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TTGTTTAGAA TCCGTAGTTA TTTCAGCTAA AACTTCATCG TTTTGCATCA ATGCTACTGA 
TAATGGTTGA TTCGATGTAT CAATGAGCAG CGAATTCATG G AT AATTGC C TCCTTAATTT 
GTTCATAATG TTCTCCTTGC GCGAACAACT CAATTTGTCT TGTATTTTCA GATATTGTTG 
AAATGTTAAT AGATAAATGC GTCGCTGGAA GTAAATCTTT TATAAATTGA CTCCATTCAA 
TAACAGTAAT TGCCTGATCT TCGAAAAATT CATCAAATCC TAAATCTTCA TCAGAATCTT 
CTAAGCGATA ACAATCCATA TGATGCAATT TTAAATTTTT ACCCCTATAT GATTTAATGA 
TGTTAAATGT CGGGGAATTA ATCGTACGTC TTACACCAAG AGCTTTTCCT ATAAATTGCG 
TTAACGTTGT TTTACCTGCT CCTAAATCTC CGTTAAGTAA AATCAAATCA CCACTTTTCA 
ATTGCTCAAC TAAAAATATA GCAAATTGAT TCATTTCATC TAAATTATTT ATCTTTATCA 
ATGTTGATTC TCCTATATTA TGCTTTTCAT TCATAAAAAT GATTATCCAT TGTTCAATCG 
TATCTAACTT TATATTTAAC CTTTATATTG TAACAAATTT CAACTTAAAT TTCTTATCTT 
TGAAACAGAT TATCTATTCA AAGTTAATTG TAAGAAAATT TAAAATATTT GTTGACATAC 
TAAAGCAGAT ATAGTAAATT AAATTTATCA AATTTTTAGA CAATTCTAAC TATTAAAGTG 
ATATATACCA TTCACGGAAG GAGTATAATA AAATGCTTAA TCAATATACT GAACATCAAC 
CGACAACTTC AAATATTATT ATTTTATTAT ACTCTTTAGG ACTCGAACGT TAgTAAATAT 
TTACTAAACG CTTTAAGTCC TATTTCTGTT TGAATGGGAC TTGTAAACGT CCCAATAATA 
TTGGGACGTT TTTTTATGTT TTATCTTTCA ATTACTTATT TTTATTACTA TAAAACATGA 
TTAATCATTA AAATTTACGG GGGAATTTAC TATGCGAaCG AgcATGATCA AAAAAGGAGA 
TCACCAAGCA CCAGCAAGAA GTCTTTTACA TGCCACGGGC GCGCTAAAAA GTCCAACTGA 
TATGAACAAA CCATTTGTAG CTATTTGTAA CTCTTATATT GATATTGTTC CTGGACATGT 
TCAQTTGAGA GAGCTTGCAG ATATAGCTAA AGAAGCAATT AGAGAAGCCG GTGCCATTCC 
ATTTGAATTC AATACAATTG GTGTTGATGA TGGAATAGCT ATGGGACATA TCGGAATGCG 
ATATTCTCTA CCATCACGTG AAATTATTGC AGATGCAGCT GAAACTGTAA TTAACGCTCA 
TTGGTTTGAC GGCGTATTTT ACATTCCTAA TTGTGACAAG ATTACACCCG GTATGATTTT 
AGCAGCCATG AGGACAAACG TACCAGCTAT CTTTTGCTCT GGTGGACCAA TGAAAGCTGG 
CTTATCTGCA CATGGAAAAG CATTAACACT TTCATCAATG TTTGAAGCAG TCGGCGCATT 
TAAAGAAGGA TCGATTTCTA AAGAAGAATT TTTAGATATG GAACAAAATG CCTGCCCTAC 
TTGTGGTTCA TGTGCTGGGA TGTTTACTGC AAATTCAATG AACTGTTTGA TGGAAGTTTT 
AGGTCT AG CA TTACCATACA ACGGTACTGC ACTTGCAGTC AGTGATCAGC GACGAGAAAT 
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TATCGTTACT CGCGAAgCAA TTGATGATGC 
AACAAACACG GTACTGCATA CGTTAGCCAT 
6 AGAGCGCATT AATGCTATTG CCAAACGCAC 

ATCGTATTCA ATGCATGATG TGCATGAAGC 
GATGAAGAAA GATGGCACGT TACACCCAGA 

10 

TGAAAATAAC GAAGGCAAAG AAATTAAGAA 
ATATGATGCA CAAGGCGGTT TATCTATCTT 

1S TATTAAAGTT GGCGGCGTTG ATCCATCTAT 

CAATTCGCAT GATGAAGCTG TTGAAGCAAT 
CGTTGTCATT AGATATGAAG GACCTAAAGG 

20 TACTTCCTCT ATTGTTGGTC GCGGCTTAGG 

TTTTTCCGGT GCCACAAGAG GTATTGCAGT 
TGGACCAATT GCCTTAATTG AAGATGGTGA 

25 ATTAAACGTA AACCAGCCTG AAGATGTTCT 

TAAAGCGAAA GTAAAAACAG GTTATCTAGC 
TACAGGTGGG GTCATGCAAG TCCCTGAGAA 

30 

GGTTAAAATG TCTAAAACTC AACATGAAGT 
TGAATCACTT GAACCTGAAC AACTAAATGA 
AGAAGTGCTA GTAGAAGCTC TACTTAAAGA 

35 

TGGTGCCGTA CTACCTTTAT ATGACACGTT 
AAGACACGAA CAAGGTGCTG TTCATGCTGC 

40 GGCGTCGTTG TAGTTACAAG CGGTCCaGGT 

GCACATTGCG ACTCTTTACC TCTAGTTGTA 
GGTAAAGATG CATTCCAAGA AGCGGATATT 

45 AATTATCAAG TGAAACGTGT TGAAGATATC 

GCTAATTCTG GACGCAAAGG TCCTGTAGTG 
GCTACAAATG TGGATTTATG CGACGAAATC 

50 

CCAGAAAATA AAGACATTGA CACTTTCATC 
GTATTAGCCG GCGCAGGTAT TAATCAATCA 

55 



ATTTGCACTT GATATGGCTA TGGGTGGTTC 4500 

TGCCAATGAA GCTGGTATTG ATTATGACTT 4560 

GCCATATTTA TCAAAAATAG CACCTAGTTC 4620 

TGGTGGCGTC CCAGCAATTA TTAATGAATT 4680 

TAGAATCACA GTTACTGGCA AAACGTTACG 4740 
CTTTGATGTC ATTCACCCTC TTGATGCACC . 4800 

ATTTGGTAAT ATCGCCCCTA AAGGCGCAGT 4860 

CAAAACATTT ACTGGGAAAG CAATTTGTTT 4920 

AGACAATCGT ACCGTTCGTG CAGGCCACGT 4980 

TGGACCAGGT ATGCCTGAAA TGTTAGCACC 5040 

TAAAGATGTT GCATTAATTA CTGATGGGCG 5X00 

TGGTCATATT TCCCCTGAAG CTGCATCTGG 5160 

TGAGATTACT ATTGATTTAA CAAATCGTAC 5220 

AGCGCGTCGC CGAGAATCTT TAACACCATT 5280 

TCGTTATACT GCCCTAGTAA CTAGCGGAAA 5340 

TTTAATTTAA TTTATTTTTA TATTGGAGAT 5400 

AAACCAAAAT ATTGACCCTT TAAAAATGGC 5460 

AAAAACTTTA AATGATATGC GTTCAGGATC 5520 

AAATGTGGAT TATTTATTCG GTTATCCTGG 5580 

TTATGATGGT AAAATCAAAC ATATTTTAGC 5640 

AGAAGGTTAT GCACGTGTAT CTGGTAAamT 5700 

GCAACTAATG TAATGACAGG TATTACGGAT 5760 

TTCACTGGAC AAGTTGCTAC ACCAGGCATT 5820 

CTATCTATGA CTTCACCAAT TACAAAACAA 5880 

CCTAAAATCG TACACGAAGC TTTCCATGTA 5940 

ATTGATTTTC CAAAAGATAT GGGTGTTTTA 6000 

AATATTCCAG GTTATGAAGT TGTTACAGAA 6060 

TCACTTTTAA AAGAAGCGAA AAAGCCTGTC 6120 

AAATCAAATC AATTATTAAC ACAGTTTGTT 6180 
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GATACACTAT TTTTAGGTAT GGGAGGAATG CATOGTTCTT ATGCTAGTAA CATGGCATTA 6300 

ACTGAOTGTG ATTTACTCAT TAATTTAGGT AGCCGCTTCO ATGATAGATT AGCAAGCAAA 6360 

CCTGATGCCT TTOCACCTAA CGCCAAAATT GTACATGTAG ATATTGATCC TTCAGAAATC 6420 

AATAAAGTTA TTCATGTAGA TTTAGGTATT ATTGCAGACT GTAAAAGATT TTTAGAATGT 64 80 

TTAAATGATA AAAATGTTGA GACTATAGAA CACAGTGACT GGGTTAAACA TTGTCAAAAT 654 0 

AATAAGCAGA AACACCCATT TAAACTTGGT GAAGAAGATC AAGTATTTTG TAAGCCACAA 6600 

CAAACAATCG AATATATCGG CAAAATTACA AATGGTGAAG CAATTGTTAC TACAGACGTG 6660 

GGACAACATC AAATGTGGGC AGCTCAATTT TATCCATTTA AAAATCACGG ACAATGGGTT 6720 

ACAAGCGGTG GTTTAGGAAC AATGGGATTC GGTATTCCTT CGTCAATTGG TGCCAAATTA 6780 

GCTAATCCTG ATAAAACAGT CGTATGTTTC GTCGGTGACG GTGGTTTCCA AATGACAAAC 6840 

20 CAAGAAATGG CACTTTTACC CGAATATGGT TTAGATGTCA AAATCGTACT AATCAATAAT 6900 

GGAACATTAG GTATGGTTAA ACAATGGCAA GATAAGTTCT TTAATCAACG CTTCTCACAC 6960 

TCAGTATTTA ATGGTCAACC TGATTTTATG AAAATGGCAG AAGCATATGG CGTCAAAGGT 7020 

25 TTCTTAATCG ATAAGCCAGA ACAACTGGAA GAACAATTAG ATGCAGCGTT TGCTTATCAA 7080 

GGACCAGCTT TAATTGAGGT TCGTATTTCC CCTACTGAAG CTGTAACCCC AATGGTTCCG 714 0 

AGTGGCAAAT CAAATCATGA AATGGAGGGC TTATAATGAC AAGAATTCTT AAATTACAAG 72 00 

TTGCGGATCA AGTCAGCACG CTAAATCGAA TTACAAGTGC TTTTGTTCGC CTACAATATA 7260 

ATATCGATAC ATTACATGTt ACAGATTCTG AACAACCTGG GATTTCTAAC ATGGAAATTC 7320 

AAGTCGATAT TCAAGATGAT ACATCACTTC ATATATTAAT TAAAAAATTA AAACAACAAA 73 80 

TTAATGTTTT AACGGTTGAA TGCTACGACC TTGTTGATAA CGAAGCTTAA TTTTAAGACA 744 0 

AAGGfiAATGA TGCGCTAATT AGTTATAGAT ATATCATAGG CTGCTAGTTA ACATCTGCCA 7500 

CTATTACAAA GTTATATTTC AGAATTTTCG AAACACAAAA TATTTAATTA TTTGGAGGAA 7560 

TTTATTATGA CAACAGTTTA TTATGATCAA GATGTAAAAA CGGACGCTTT ACAAGGCAAA 7620 

AAAATTGCAG TAGTAGGTTA TGGATCACAA GGTCACGCGC ATGCACAAAA CTTAAAAGAC 7680 

AATGGATATG ATGTAGTCAT CGGCATTCGC CCAGGTCGTT CTTTTGACAA AGCTAAAGAA 774 0 

GATGGATTTG ATGTGTTCCC TGTTGCAGAA GCAGTTAAGC AAGCTGATGT AATTATGGTG 7800 

CTATTACCTG ATGAAATTCA AGGTGATGTA TACAAAAACG AAATTGAACC AAATTTAGAA 7860 

AAACATAATG CGCTTGCATT TGCTCATGGC TTTAACATTC ATTTTGGTGT TATTCAACCA 7920 

CCAGCTGATG TTGATGTATT TTTAGTAGCT CCTAAAGGAC CGGGTCATTT AGTTAGACGT 7980 
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CAAGCACGTA 


ATATTGCTTT 


AAGTTATGCA AAAGGTATTG 


GTGCAaCTCG 


TGCAGGTGTT 


O X u u 




ATTGAAACAA 


CATTTAAAGA AGAAACTGAG ACAGATTTAT TTGGTGAACA AGCAGTACTT 


oioU 


5 


TGCGGTGGTG 


TATCGAAATT 


AATTCAAAOT 


GGCTTTGAAA 


CATTAGTAGA 


AGCGGGTTAT 


OaXU 




CAACCAGAAT 


TAGCTTATTT 


TGAAGTATTA 


CATGAAATGA 


AATTAATCGT 


TGATTTGATG 




10 


TATGAAGGCG 


GTATGGAAAA 


TGTACGTTAC 


TCAATTTCAA 


ATACTGCTGA 


ATTTGGTGAC 




TATGTTTCAG 


GACCACGTGT 


TATCACACCA GATGTTAAAG 


AAAATATGAA 


AGCTGTATTA 


8400 




ACTGATATCC 


AAAATGGTAA 


CTTCAGTAAT 


CGCTTTATCG 


AAGACAATAA 


AAATGGATTC 


8460 


15 


AAAGAATTTT 


ATAAATTACG 


CGAAQAACAA 


CATGGTCATC 


AAATTGAAAA 


AGTTGGTCGT 


8520 




QAATTACGCG 


AAATGATGCC 


TTTTlTTl iv & 


TCTAAAAGCA 


TTGAAAAATA 


AGATAGACCT 


8580 




ACAATGAGGA 


GTTGTTAAAT 


A XVSnVj A JVa lv 


ATATTCAAAT 


TTTTGATACG 


AGACTAAGAG 


8640 


20 


ACGGTGaACA 


AACACCAGGA 




CTTTTGATGA 


ACGCTTGCGT 


ATTGCATTGC 


8700 






ATGGGGTGTA 


IrAlVjl 1A1 XVJ 


AAGCTGGATT 


TCCTGCTTCA 


AGTACAGGTA 


8760 






TGTTCAAGCA 




CATTAACAAC 


AACGGCTGTA 


TfSTfinTTTAfl 

■A \J A \J w X A X 


8820 


25 




AAAATCTGAC 


nX UuA luL X *J 


TATATGAAGC 


AACAAAAGAT 




8880 






TGTTTTTATA 




CTATTCATCT 


TGAACATAAA 




8940 






CGTTTTAGCA 


TCTATTAAAG 


AACATGTCAC 


ATACGCGAAA 




9000 


30 


ACGTTGTTCA 


ATTTTCACCT 


GAAGATGCAA 


CGCGTACTGA ATTACCATTC 


TTAGTGAAAT 


9060 




GTGTACAAAC 


TGCCGTTGAC 


GCTGGAGCTA 


CAGTTATTAA 


TATTCCTGAT 


ACAGTCGGCT 


9120 


35 


ACAGTTACCA 


TGATGAATAT 


GCA CATATTT 


TCAAAACCTT 


AACAGAATCT 


GTAACATCTT 


9180 


CAAATGAAAT 


TATTTATAGT 


GCTCATTGCC 


ATGACGATTT 


AGGAATGGCT 


GTTTCAAATA 


9240 




GTTTAGCTGC AATTGAAGGC 


GGTGCGAGAC 


GAATTGAAGG 


CACTGTAAAT 


GGTATTGGTG 


9300 


40 


AACGAGCAGG 


TAATGCAGCA 


CTTGAAGAAG 


TCGCGCTTGC 


ACTATACGTT 


CGAAATGATC 


Olf ft 

93o0 




ATTATGGTGC 


TCAAACTGCT 


CTTAATCTCG 


AAGAAACTAA 


AAAAACATCG 


GATTTAATTT 






CAAGATATGC 


AGGTATTCGA 


GTGCCTAGAA 


ATAAAGCAAT 


TGTTGGCCAA 


AATGCATTTA 




45 


GTCATGAATC 


AGGTATTCAC 


CAAGATGGCG 


TATTAAAACA 


TCGTGAAACA 


TATGAAATTA 


9540 




TGACACCTCA 


ACTTGTTGGT 


GTAAGCACGA 


CTGAACTTCC 


ATTAGGAAAA 


TTATCTGGTA 


9600 




AACACGCCTT 


CTCAGAGAAG 


TTAAAAGCAT 


TAGGTTATGA 


CATTGATAAA 


GAAGCGCAAA 


9660 


50 


TAGATTTATT 


TAAACAATTC 


AAGGCCATTG 


CGGACAAAAA 


GAAATCTGTT 


TCAGATAGAG 


9720 




. ATATTCATGC 


GATTATTCAA 


GGTTCTGAGC 


ATGAGCATCA 


AGCACTTTAT 


AAATTGGAAA 


9780 
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AAGAGGGTCA 
ATGCAGTTGA 
TCACTGAAGG 
CTGTCAATGG 
AAGCACATGC 
TAACATTGTT 
ATTGCTTGAA 
TGGTGGTGCC 
TAAAAGAGCA 
CAATCGACCA 
ACGCCCCACT 
TGAAGGCACA 
TAGACATTTT 
ACGCATTGTT 
TGATAAAGAA 
TGAATTATAT 
AATCACAAAT 
AAGTGATGAA 
TAACGATGGT 
AAACGTTGCC 
AAATCAACCA 
GCAAACGACA 
TCAAAAATTG 
GGAACAGACA 
ACCTTATACA 
AATTAAGACG 
T ATT CAAT AT 
TAGATTTTGG 
TAGG AC CTG A 



TATTTACCAG 
TCGTATTTTC 
TACTGATGCC 
CTTTGGTATT 
TAAATTTGCA 
GCCCTACCTG 
ATTATAAGTA 
TCTATTGATA 
GATGCTATTT 
GAACAAGGAT 
ACCGTTGTCA 
GATTTAGTTA 
AATAATCACG 
CACGTAGCAT 
AATGTATTAG 
CCAGAAGTAA 
CCAAAACAAT 
GCTTCAGTGA 
CCAAGATTGT 
AATCCATTTG 
GATGCTGCAG 
GCAGATTTAG 
AATCACTAAG 
TGTGTTATAC 
TGAAGTTACT 
CCCAGATTTA 
TAAAGATGAA 
GGTGCATATT 
GACAGGACTT 



GATTCAAGTA 
CAGAAAGAAA 
CAAGCAGAAG 
GATCATGATA 
GCTGAAAATG 
GTGATGGAAT 
ATAAATATAA 
CATTCGGOGA 
TACTGGGTGC 
TATTAAAATT 
AAGGCG CTAG 
TAGTCCGTGA 
AGGCCTTAGA 
TTAAATTGGC 
CTTCTAGTAA 
CAGTAAATCA 
TTGACGTCAT 
TTCCTGGTTC 
ATGAGCCTAT 
GAATGATTCT 
ATGAATTAGA 
GCGGCAAATT 
GGGGAGATGT 
GGGAAATTGG 
TCTCCTCAAG 
ACATTTGCAA 
ATTGCAAACA 
TTTGATATGG 
ACACAGC CTG 



TTGGTACTGG 
CAGAATTAAT 
TACATGTAAA 
TTTTACAAGC 
TTGAGAAGGT 
CGGTCCAGAA 
CTTTAATTAT 
GCCTTTAACT 
AATOGGTGGA 
GCGTAAATCC 
TTCTTTATCA 
ATTGACAAGT 
TTCTCTTACT 
CGCTTCAAGA 
ATTGTGGCGC 
CTTATTTGTT 
CGTATGTGAA 
ACTTGGTTTA 
TCATGGATCA 
ATCTTTAGCG 
ACAACATATT 
GAATACTACT 
AAATGGGTCA 
GCGAACCGCA 
CATTTGAAGG 
CACTCGATCA 
AACAAATCAC 
GTTCTGATGA 
GCAAGACAAT 



TTCAATCGTA 
TGATTATCGT 
TTTATTGATT 
CTCTTGTAAA 
AGGTAATTAA 
ATTTTGAACG 
CAAAT AG AG C 
GAGAAAACCT 
CCTAAATGGA 
TTAAATTTAT 
CCTTTAAAGG 
GGTATTTATT 
TATACAAGAG 
CGAGGAAAAC 
AAAGTCGTAA 
GATGCTTGTA 
AACTTATTTG 
TCACCTTCTG 
GCACCAGATA 
ATGTGTTTAC 
TATAGCATGA 
GATATTTTCG 
AACATTATTT 
ACTATTATAC 
ACTTAGGCTT 
CAATGTTCCT 
AACATTACAA 
ACAAGGTATT 
CGTTTGTGGT 



GCAATTTACA 
ATTAATTCTG 
GAAGGTAAGA 
GCATACGTAG 
TTATGACTTA 
GATCTCTATC 
ACCACGAATT 
TAAATGCGTG 
CAGATCCTAA 
TTGTAAATAT 
AAGAACGCGT 
TTGGAGAACC 
AAGAAATAGA 
TAACATCAGT 
ATGAAGTAAG 
GTATGCATTT 
GCGATATTTT 
CTAGTTTTAG 
TTGCAGGTAA 
GTGAAAGCTT 
TTGAACATGG 
AAATTCT AT C 
GACAAGGTGT 
ATTGATTTAC 
CAAAACAGAA 
ACTATTGATA 
AAAAACGCCA 
GTTCACATGG 
GACTCTCACA 
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ATGTTTTCGC 


AACTCAAACG 


CTATGGCAAA 


CAAAACCCAA 


AAACTTAAAA 


ATCGATATTA 


11700 




ATCGTACCTT 


ACCAACAGGC 


GTCTATGCTA 


AGGACATTAT 


TCTGCATTTA 


ATTAAAACGT 


11760 


5 


ATGGTOTTGA 


CTTTGGTACA 


GGCTATGCTT 


TGGAATTTAC 


TGGCGAAACA 


ATTAAAAACC 


11820 




TTTCAATGGA TGGTCGAATG ACTATTTGTA ACATGGCTAT OGAAGGTGGT GCCAAATACX5 


11880 




GCATAATCCA 


ACCTGATGAT 


ATAACATTTG 


AATATGTTAA 


AGGGAGACCA 


TTTGCCGATA 


11940 


10 


ACTtCGCTAA ATCAGTTGAT AAGTGGCGTG AgCTATATTC TGATGACGAC GCGATATTTG 


12000 




ATCGTGTAAT 


TGAACTTGAT 


GTTTCAACAT 


TAGAACCACA 


AGTGACATGG 


GGAACTAATC 


12060 


1S 


CTGAAATGGG 


TGTTAATTTC 


AGTGAACCAT 


TCCCTGAAAT 


CAATGATATC 


AACGATCAAC 


12120 


GTGCGTATGA 


TTATATGGGG 


TTAGAACCAG 


GTCAAAAAGC 


TGAAGACATC 


GACTTAGGGT 


191 Art 




ATGTTTTTCT 


CGGTTCATGT 


ACAAATGCXA 


GACTATCAGA 


TTTGATTGAA 


GCTAGTCATA 




20 


TTGTTAAAGG 


AAATAAAGTT 


CAT C CAAAT A 


TT A CAGCT AT 


TGTCGTACCA 


GGTTCTCGTA 






CAGTAAAAAA 


AGAAGCAOAA 


AAATTAGGTC 


TAGATACTAT 


CTTTAAAAAT 


GCAGGATTTG 






AATGGCGTGA 


ACCAGGATGT 

r. 


TCAATGTGTT 


TAGGCATGAA 


TCCTGACCAA 


GTACCTGAGG 




25 


GCGTACATTG 


TGCATCTACA 


AGTAATCGAA 


ACTTTTGAAGfl 


ACGACAAGGC 


AAAGGTGCAA 


12480 




GAACACATTT 


AGTATCCCcT 


GCTATGGCAG 


CAGCAGCAGC 


TATTCATGGT 


AAATTTGTGG 






ACGTAAGAAA 


GGTGGTTGTT 


TAAATGGCAG 


CAATCAAACC 


TATTACAACA 


TATAAAGGTA 


i o c r\ 


30 


AAATAGTCCC 


TCTCTTCAAC 


GACAATATCG 


ATACAGACCA 


AATCATTCCT AAGGTACACT 


i o n 




TAAAGCGTAT 


TTCAAAAAGT 


GGCTTTGGTC 


CATTTGCTTT 


TGATGAATGG 


CGGTACTTAC 




35 


CTGATGGTTC 


AGATAATCCT 


GAi i xCAATC 


CTAACAAACC 


ACAATATAAA 


GGGGCTTCTA 


1 0*7Qri 


TTTTAATTAC 


TGGAGATAAT 


TTTGGATGTG 


GTTCAAGTCG 


TGAACATGCT 


GCTTGGGCTC 


1 OftA A 
A A 0*B\J 




TTAAGGACTA 


TGGTTTTCAT 


ATTATTATTG 


CAGGAAGTTT 


CAGTGACATA 


TTTTATATGA 


12900 


40 


ATTGCACTAA 


AAATGCGATG 


TTGCCTATCG 


TTTTAGAAAA 


AAGTGCCCGT 


GAACATCTTG 


12960 




CACAATATGT 


TGAAATTGAG 


GTCGATTTAC 


CAAATCAAAC 


TGTGTCATCA 


CCAGACAAGC 


13020 




GTTTCCATTT 


TGAAATTGAT 


GAAACTTGGA 


AGAATAAACT 


TGTAAATGGC 


TTAGATGACA 


13080 


45 


TTGCAATCAC 


CCTACAATAT 


GAATCATTAA 


TAGAAAAATA 


TGAAAAATCa 


CTTTAAGGGA 


13140 




GTTGAATATT 


ATGACAGTCA 


AAACAACAGT 


TTCTACGAAA 


GATATCGATG 


AGGCATTTTT 


13200 




AAGACTTAAA 


GATATTGTCA 


AAGAAACACC 


TTTACAATTA 


GACCATTACT 


TATCTCAAAA 


13260 


50 


GTATGATTGT 


AAAGTCTATT 


TAAAACGAGA 


AGATTTACAA 


TGGGTACGTT 


CTTTTAAATT 


13320 




AAGAGGTGCT 


TACAACGCTA 


TTTCTGTTTT 


ATCAGATGAA 


GCTAAAAGTA 


AAGGTATTAC 


13380 
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AAACGCTGTT 


ATCTTTATGC 


• CAGTCACTAC 


ACCTTTACAA 


AAGGTAAATC 


AAGTAAAGTT 


13500 




CTTTGGAAAT 


AGTAACGTTG 


AAGTTGTACT 


CACTGGTGAT 


ACATTTGATC 


ACTGTTTAGC 


13560 


5 


TGAAGCTTTA 


ACTTATACAA 


GTGAACATCA AATGAACTTT 


ATAGATCCAT 


TCAATAATGT 


13620 




TCATACAATT 


TCTGGACAAG 


GTACGCTTGC 


TAAAGAAATG 


CTAGAACAAG 


CAAAGTCTGA 


13660 


10 


CAATGTTAAC 


TTTGATTATC 


TATTTGCCGC 


AATTGGTGGT 


GGOGGTTTAA 


TTTCAGGTAT 


13740 


TAGTACTTAC 


TTTAAAACCT 


ATTCACCTAC 


CACGAAAATT 


ATAGGTGTTG 


AACCTTCAGG 


13800 




TGCAAGTAGT 


ATGTATGAAT 


CTGTTGTGGT 


AAATAATCAG 


GTAGTCACAT 


TGCCTAATAT 


13860 


1S 


CGATAAATTT 


GTGGACGGTG 


CATCTGTAGC 


TAGAGTTGGC 


GATATTACAT 


TTGAAATTGC 


13920 




AAAAGAAAAT 


GTAGATGATT 


ACGTTCAAGT 


AGATGAAGGT 


GCAGTTTGTT 


CTACGATTTT 


13980 




AGATATGTAT 


TCAAAACAAG 


CAATTGTAGC 


AGAACCTGCT 


GGCGCATTAA 


GTGTAAGTGC 


14040 


20 


GCTTGAAAAC 


TATAAAGATC 


ATATTAAAGG 


TAAAAGAGTG 


GTTTGTGTCA 


TTAGTGGTGG 


14100 




TAATAATGAT 


ATTAATCGAA 


TGAAAGAAAT 


TGAAGAACGT 


TCATTACTAT 


ACGAAGAAAT 


14160 




GAAGCATTAC 


TTTATCTTAA 


ATTTCCCTCA 


ACGTCCAGGT 


GCATTGAGAG 


AATTTGTAAA 


14220 


25 


TGACGTATTA 


GGAC CTCAAG 


ACGATATTAC 


TAAATTTGAA 


TACTTAAAAA 


AATCTTCTCA 


14280 




AAATACAGGT 


ACTGTCATTA 


TTGGTATTCA 


ACTTAAAGAT 


CATGATGATT 


TAATACAACT 


14340 




CAAACAACGT 


GTAAAtCATT 


TCGATCCTTC 


CAATATTTAT 


ATTAATGAAA 


ATAAGATGTT 


14400 


30 


ATATT CATTG 


TTAATTTAAC 


ACATAGTAAG 


AAAAACAGTC 


ATAAATTGAT 


TTCTAATTGA 


14460 




AATCATCTTA 


TGACTG CTTT 


TTATTATACT 


TTACATTTCT 


CGTTTCGTCA 


GATTCAAACG 


14520 


35 


TTTTCACTTC 


GCCAAGCCAT 


CTTTCTTTGT 


GTTTGCTTTT 


aTTTTGACGT 


TTTAGACATA 


145B0 


AAAAAaGAGA 


CCTTGCGGTC 


TCAATGCGGC 


TCATCGCATC 


CACTTTTTGC 


CTGGCAACGT 


14640 




TCTACTCTAG 


CGGAACGTAA 


GTTCGa CTAC 


CATCGACGCT 


AAGGAGCTTA 


ACTTCTGTGT 


14700 


40 


TCGGCATGGG 


AACAGGTGTG 


ACCTCCTTGC 


TATAGTCACC 


AGACATATGA 


ATGTAATTTA 


14760 




TACATTCAAA 


ACTAGATAGT 


AAGTAAAAGT 


GATTTTGCTT 


CGCAAAACAT 


TTATTTTGAT 


14820 




TAAGTCTTCG 


ATCGATTAGT 


ATTCGTCAGC 


TCCACATGTC 


ACCATGCTTC 


CACCTCGAAC 


14880 


45 


CTATTAACCT 


CATCATCTTT 


GAGGGATCTT 


ATAACCGAAG 


TTGGGAAATC 


TCATCTTGAG 


14940 




GGGGGCTTCA 


TGCTTAGATG 


CTTTCAGCAC 


TTATCCCGTC 


CACACATAGC 


TACCCAGCTA 


15000 




TGCCGTTGGC 


ACGACAACTG 


GTACACCAGA 


GGTATGTCCA 


TCCCGGTCCT 


CTCGTACTAA 


15060 


50 


GGACAGCTCC 


TCTCAAATTT 


CCTACGCCCA 


CGACGGATAG 


GGACCGAACT 


GTCTCACGAC 


15120 




GTTCTGAACC 


CAGCTCGCGT 


AC CG CTTTaA 


TGGGCGAACA 


GCCCAACCCT 


TGGGAC CGAC 


15180 
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GTGGAACTT 1524 9 

(2) INFORMATION FOR SEQ ID NO: 103: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14051 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

70 



(Xi) SEQUENCE DESCRIPTION : SEQ ID NO: 103: 



IS 


GTGGCAATAT 


TTCTAGTTCT 


CGTTTTGATA 


AGATTTTAAA 


AGGATCTGTT 


GTGTTTGCAG 


60 




TGTCCTGATT 


TGAATTAGAT 


ACAAATTCAT 


TCACTAAAGA 


TGTTGTAAGT 


TTCATATCTA 


120 




CATATGTTTC 


ACCTTTATAT 


ACAGTTCGAA 


TAGCTAACAA 


TAATTGTTCA 


TCAGGTGCAT 


180 


20 


TTTTCAATAT 


GTAACCTTTC 


GCACCATTAC 


GCAACACATG 


GAACAAATAC 


TCCTCATCAT 


240 




CAAACATTGT 


TAATATTAGT 


ATTTTAGTTT 


CAGGAAAACT 


GTCAGCAATT 


TTACTCGTAG 


300 




CGATAAGACC 


TGACTCACCT 


GGTGG CATAC 


TTAAATCCAT 


TAGTAACACA 


TCAGGTTTAt 


360 


25 


ATTCCATTAC 


TTTTTGGTAA 


GCTTCGACGC 


CATCTGCAGC 


CGTTGCAACA 


ACTTCCATAT 


420 




CATTTTGATA 


ATTTAAAATC 


ATAGAGAACC 


CCGTACGGAC 


AACAGCGTGA 


TCATCGGCAA 


480 




TGACTATTTT 


CAATTTTATT 


CCCCCAATGT 


ATGTTTCAAA TTGGAATGTT 


CAATGTAACA 


540 


30 


TTGGTACCCT 


CACCAATTTT 


CGTTTCAATA 


TTGACGCTAC 


CGCTGACTAA 


CTCAGCTCGC 


600 




TCATTCATTC 


CATATAAACC 


GAGTCCAGAA 


CCTTTAGGCT 


TAGAACTTGG 


ATCAAAACCA 


660 


35 


TTTCCCGCAT 


CTATCACTTC 


TGCTACCAAA 


TGGCGCCCAG 


TTTGACGGAT 


ACCTACATTT 


720 


ATTTCATTTA 


CATCAGCGTA 


TTTCAACGCA 


TTTAAAATAG 


CTTCTTGCAC 


TACTCGATAA 


780 




ACAACCGTTT 


CAATATCACT 


ATCAAAGCGA 


GTATTTTTAA 


TATTTGATGT 


ATATATGATT 


840 


40 


TTTATTCCAT 


AATTTTCTTC 


AAACTGTTTA AAATATGATT 


TAAAAGCTGC 


TTCAAGGCCT 


900 




AGATCATCCA 


AAGAAGCGGG 


TCTTAATTCA 


ACCGACATAT 


TACGTATATC 


ATCAATTAAT 


960 




TTAGCGACAA 


TATATTCAAT 


ATTTTCTGCG 


TCTTCCAAAA 


GCTTAGTTGT 


ATCTTCTTGA 


1020 


45 


TATTTTAATA 


ATCTCAATTG 


AACATCTACA 


TTGAGCATTT 


CTTGAATCAC 


ACTATCATGT 


1080 




AACTCTCTAG 


AAATTCGCTT 


TCTTTCATTT 


TCTTGGGCTG 


AGATTGTTTT 


ACGCATCATA 


1140 




CGTTGTTGAT 


GCAATTTCTC 


TTGCTGTTCA 


ATTTGTGATG 


AAACATTTTG 


AAGCGTAAAT 


1200 


50 


GCATGAATTC 


CCCTGTCTTG 


ATCAATCAAC 


TGATATGTTG CTGTAAATGG 


CATCACTTTT 


1260 




TGATCTTTCG 


TCTTCATAAA 


TACTTGGAAA 


TTCGTAGCTT 


GTACTTGCAT 


CGATTCTAAG 


1320 
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ATCGCATTCG CCACAGCACT GTAATTATCT TCTTCAGATA ATATATCTTT AGCAGCATCA 1440 

TTCATTGCAA TAATTTTACC GTTATCATCA GCAAAAACTA TCTTTTCGAT TGAATGCTCA 1500 

TAATATTTTT TCAATAAAGT ATCTAACTGT ATACTGTCCT CATTAATCAT GACTTACACC 1560 

CTAATTCATC TCATTATTTA TCATCATTGA AAATACCAAA CTTACGTTGA ATATCATCAT 1620 

TATCAAATAT TTTTGGTAAA GGACGACCAT CTCTTTGACC AAATAATAGT ACGCCATACA 1680 

CTTGATTCTT ATACCAAAGC GGCACTGCTA AAACTGCTGT TAATGATTCG CTCAATAAAA 1740 

TTGGATAGTC AATCTTTTCT TCAGGCCCTA AAGCTAAACC AACATTGGCT ATTACCATAC 1800 

GCTTTCCTGT TTTCATAACA GTTCCAGCTA ATCCACGACC TTTTCTTAAA ATAATCAATT 1860 

TAAATCGATT ATTTTTATTA CCTGAAACAT AGTGCCATTT TATTGGAGAT GATGGTTTGT 1920 

TAGATTCATA GAAAGCOATT GCCGCAAAAT CATAACCCTC TTCTTTGCGT ATTTTATCTA 19 90 

ATGTCTCTTG AAATCTACGA TCTTCAATTA TTGCTTCTGG TGTCAAATCC TTTCACCTCT 2040 

TATGCTTACA CTTTATTCTT ACGGTAAATA ATATATCTGC GATTTATATA TGTCAAAGGT 2100 

ACACTCCAAA CATGCACCAA ACGTGTAAAT GGCCAACAAG CCATAATAGT GAAACCTAAC 2160 

25 AATATATGCA TTTTAAATGC AATCGGCACA CCACTCATCA ATGACGCATC TGGTTTTAAC 2220 

ATAAATAATT GTCTAAACCA AATTGATAAT GAAGTTCTGT AGTTAAAGTC TGGATGTTGT 2280 

ATATTTGTTA CTAATGTTGC GTAACATCCC ATAAATACGA TAAGTAATAA TAAGAAATTT 2340 

30 ACAAATATAT CCGACGCTGA ACTTAATCTT CGAATACTTT TCGTAGTAAC ACGTCTCGCT 2400 

GTTAATAAAA ACATCCCTAT CAAAGTTATT ATACCAAAGA TGCTACCAAT ATAAACAGCG 2460 

CCTATATGAT ATAAATGCTC AGACACACCC ACTGCATCCA TCCATGGTTT CGGTATTAAC 2520 

AATCCAACTA CGTGTCCAAA AAACACTGGA ATAATACCTA AGTGAAATAA TAAACTTCCC 2580 

CACATCAACC TTTTTCTTTC TATTAATTCA CTAGATTTAG CTGTCCAAGA AAATTTATCA 2640 

TAACGATAAC GTG CAATATG ACCTGCGACA AAGACAACTA AACATAAATA CGGAAATATA 2700 

ACCCATAAAA ACTGATTAAG CATGATGTTT CACTCCTTTT GGTGATGTCA AACATAATTT 2760 

CAATGTTTTT CTAAGTGCTT GAATCACATA GGCATATGGA TTGTTATCTT CACCAAGTGC 2820 

45 ATTCGCCATC ACATATGTTC CATCCTCAAT AATCATAATG ATTAATTGAA TATTCTCTTC 2880 

AGCTCTTGGA TCATTTCGCC ATTCTGCCAC TTGCAAAAAT TGAAGCATCA ACGGTAGATA 2940 

ATCAGAAAGT TCATTATCTA CCATTTCTAG TCCAAACATT TCATATAATA CCTTTAATTT 3000 

50 AGCTAACATT TGCCCACGTT CTTTTTGCGT ATCAAATTTG TTATACGTCA TATATAATGG 3060 

TGCTITTTTC GTAAAATCAA ATGTATCTGT ATAAATCGCT TTGATTTCTG ATAATGAAAA 3120 
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TGTTTCTTCA AAAGTTTTTG GATGAAAAQT 
CATATATCCA AAACTTTCTT GATATTTTTT 
CTCCATAGAA ATTCTCATTA TAAATTTCTT 
CACAGCCTTC ACAGTTATCT CCAAAATGCT 
GTGCGTGATA CGTATCTAAA TAGGTTTCTT 

10 

CATATTTGGC TAGTCCTAAT AAACGATACA 
ATCGCTCTAA TCGAGACGTG TCAAATGGCT 

1$ TCATCATTGC CATACGTTGT AGGGCTCCTT 

TATTAGCTAA GTATTCAATA GGTAAACGCA 
GATTTTGAGT TGTATTTTTA CCTTCAAAAT 

20 ACCAAACCAT CGGCATCGTT CTAAATTCAG 

TTGCTAACTT ATAAATTGGA GAGTTTTGTG 
CTTTTTCAGC TTGAGCAATG ACTTCTTCGT 

25 TTTCATATAA ATCTTTCTCG TCTACTGCTG 

ATAATAAAAC ACCTAAGTAA CGCATACGTC 
TACCCGCCTC GATTCTCGGG AAACAGAAAG 

30 

TGAAGTAAAC TTT CT TATAT GGACAACCTG 
CTTGGTCAAC TAATACAATG CCATCTTCAT 
ATGCAACGCA ACTTGGATTC AAGCAATGTT 

35 

TTTCGTCAAA TTGGAATTTA ATATCTTCTT 
CTGfAACATG ACCACCTGCT AAGTCATCTT 

40 TATCCCCCGT AATTTCTGAA TACGCTCTAG 

TTGTTAAATG TTCATAATTA TAG TTCCATG 
CTGGGTTATA AAAAATTTTA CCTAAAGCAA 

45 CAAGTTTCCC TTTACGATTT AGTACCCAAC 

GTTTOGGATA CCCTACACCT GGC t TCGTTT 
CTGGACGATT TGTCCaAGTG TTTTTACATG 

50 

TATCTAAATT TAATACCATC GCAAcTTGCG 
ATCTTTCTAA CTGCTACATA TAAATCCCTT 

SS 



TAATTTTTCT GGAAAACATA ACTGTTGTGC 3240 

AAAATTATCG AAATTAATCA CGGAAAATCC 3300 

GACCAGTTTT CCCTGAACCT ACTGCAACGC 3360 

CGCCGCCGTA ATTGTATCCT GTACTACCTT 3420 

TGTGTGATGT TGGAATAACA AATCGATCTT 34 80 

TGTCTTTAGT TTGGCGCTCG GTTATACCTA 3540 

GTTGAGTAAC TTGAGATCTC AT AT AACTT C 3 600 

TTACTGGCTC TGTATCTCCT GCAGTGAAAA 3660 

TTTCTTCAAT GGCTGGGAAA ATCGCATCTG 3720 

AGCTCATAAT TGGGCTAAGT GGTGGGCAAT 3780 

GATGTAACGG AAATGCAAGT TTATATTCAA 3840 

CAGCTTCAAT CCAATCGTAA CCAATACCAT 3900 

CAAATGGGTT TAAGAATATA TCTAATTGTT 3 960 

AAGCTGCTTC ATGAACTCGA TCTGCATCAT 4 020 

CTGTACAAGT TTCAGAGCAT ACCGTAGGCA 4 0 80 

TACACTTTTC AGCTTTGTTC GTTTTCCAAT 414 0 

TCATACAGTA ACGCCATCCA CGACATGCGT 4200 

CACGTTTATA CATAGCACCT GAAGGACACG 4260 

CACATAAACG TGGTAAATAC ATCATAAAAG 43 2 0 

CTATTTTTTG GATGTTAGGA TCTTTTGGAC 43 80 

CCCAGTTAGG TCCCCATTCA ATTTCAATGT 4440 

CAACTGGCGA ATGCTTCCCT GATTTCGCAG 4500 

GCTCATAATA ATCTXTAATT AATGGCATAT 4560 

TTTTTGAAAT TCTACTTCCA GATTTTAATT 4620 

CACCTTTGTA GTGTTCTTGG TCTTCCCAAC 4680 

CTACGTTGTT GAACCACATG TACTCAGCAC 4 740 

TCACACTACA CGTATGGCAT CCTATGCATT 4800 

CTTTAATCTT CAAGCCAATT AACCTCCTTC 4 860 

TGGTTCCCAA TTGGTCCATA ATAATTAAAG 4920 
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AATGCGACAG TACTCCATCC TTCAATCGGA CGACATTTTT CTTGTCCCAC ATAGTGAGCC 6840 

CAACCGCCAC CATTCACACC TTGACAGCCA CATAACATAA CTAAGTTTAA GATTGAACGA 6900 

TAAATCGTAT CTGAGTTAAA CCAATGGTTA ATACCCGCAC CCATGATAAT CATTGAACGC 6960 

CCTTCAGTAT CGATAGOGTT TTGCGCAAAT TCTTTCGCTA CTTGAATOAC AACACTTTGT 7020 

TTTACGCCTG AAATGGCTTC TTGCCAAGCA GGTGTATATT TTGATTCTGC ATCGTCGTAT 7080 

CCTTTTGATT CTAATTTATG ATCAAAACGA OGCACGCCAT ATTGACTTGC CATTAAGTCA 7140 

AAAATTGTAG CAATACGGAC TTTGTCACCA TTTGCTAAAG TGACTTGTCG AGTTGGAATT 7200 

GGAOGATTGA ATATCCCATC TCCATCACTA TCAAAGTATG GGAATTGAAT TGTTTCTAAT 7260 

TCGTATCCAC CTTCTGTCAT TGATAATGTA GGGTTAATTT TAGAACCATC TTCTGTTTCT 7320 

AGTTTTAAGT TCCACTTCTT ACCTTCTTCC CAACGTTGAC CCATTGTGCC ATTAGGTACT 7380 

20 ACTAAACTAT CGCTGATTGC ATCATGAATA ACTGGCTTCC ATTCGCCTTG CTCTGTTGTT 7440 

TGACCTAAGT CACTCGCTCT TAAAAATCGA CCCGCTTTAT ATCCATTTTC ATCTTCATCC 7S00 

AG CATGAT AA GAAACGGCAT ATCTGTATAT TGTTTAGCGT AATTTATAAA GCGTTCATTA 7560 

GGTTCATTAA CATAATGTTC TTGTAAAATA ACATGCGTCA TTGCTTGTGC AATTGCAGCA 7620 

TCTGAACCAG GATTOGGTGC TAGCCAGTTA TCTGCAAATT TCACATTTTC TGCGTAATCT 7680 

GGTGCTACTG AAATGACTTT TGTACCTTTA TAG CGGACTT CAGTCATAAA ATGTGCATCC 7740 

GGAGTACGTG TTAAAGGTAC ATTAGAGCCC CACATAATAA TGT ATGATGC GTTATACCAG 7800 

TCACTTGATT CAGGCACATC TGTTTGCTCT CCCCAAATTT GTGGAGAGGC AGGTGGTAAA 7860 

TCTGCATACC AGTCATAAAA ACTAAGCATT TCACCACCAA GCAAATTGAT GAATCGAGCA 7920 

CCTGCTGCAT AACTAATCAT TGACATCGCT GGAATAGGTG TAAATCCTGC GATTCGATCT 7980 

GGACCATATT TTTTTATTGT ATACAGTAAT TGTGCTGCGA TTATCTCTGT AACGTCTTTC 8040 

40 CAATTTGAAC GCACGTGCCC TCCCATACCT CGGGCTTGCT TATATTGTTT GGCTTTGTCT 8100 

TCATTTTCAA CAATAGACGC CCATGCAGCA ACGCGATTAC CATTGTTTTC TTCTAATGCT 8160 

TCAGTCCATA AATCCCAGAG TTTTCCACGA ATATATGGAT ATTTGATTCG AAGCGGACTG 8220 

45 TATTCATACC AAGAGAATGA CGCACCTCGT GGACATCCTC TCGGTTCATA TTCAGGCATA 8280 

TCCGGACCAC AACTTGGATA GTCAGTTTGT TGATTTTCCC AGGTAATCAC ACCATTTTTC 8340 

ACAAATACTT TCCAAGAACA TGAGCCTGTA CAGTTAACAC CATGTGTTGT TCTTACTTCT 8400 

SO 

TTATCGTGGC TCCAACGTTC TCTGTACATT TTTTCCCATT CTCTACTTTT ACTTTCTAGG 8460 

ATCGACCAAT TCCCATTAAA TTTTTCTGTT GGCTTAAAGA AATTCAATCC AAATTTTCCC 8520 
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TAAAATGCCC 


AAGACTATTG 


CTTTAATTAG 


ATTGTACATT 


TTTTCACAAA 


CATAAAATAT 


8640 




TAGGOAATCA 


CCTAATTACT 


TAAGGAATTT 


CCCTATCAAT 


AACGGGATTT 


CATTGAAATA 


8700 


5 


ATACACAATC 


ATGTATGGTC 


ATGCTTATTG 


CCAATCTAAA 


TCGTTCAAAT 


TTGGCACAAC 


8760 




GACAAATAAG 


GCTTCAACAC 


GAATATATTC 


TCTCGGTTGA 


AACCTTACTT 


ATTCATTTAT 


8820 


10 


TTTTTATAAA 


TTAGTGACAT 


AACACTGTAT 


TAGCATCTGC 


ACGATCGGTT 


GAAATATATG 


8880 


TTACATTTTC 


TTGCTGCTTA 


ATAAATGCAT 


CATAGTAATC 


ATATTGCGAC 


GAATGATATG 


8940 




TGCCATTCGA 


TGTATCATTT 


GGGTTTAGCA 


AACAGCCATA 


ACCTTCGTCA 


TATAAATGTT 


9000 


1S 


CACAGAG CAT 


AAGGGCGTCA 


TGTTTAGAAC 


CACTTACTAC 


ATAAAATTGC 


TTCATAGGAT 


9060 




CATATGATTT 


AGGAGTGTTT 


TCAGTATAAT 


CAACAACTTC 


CCCTATAATA 


CATATACCTG 


9120 




GTTTCGCCTC 


AATTGAATAG 


TGTTGCAATT 


TTGAAATAAT 


ATTACTTAAA 


CGCCCCTTAA 


9180 


20 


CAACAAACTC 


GTTAAAACAC 


GATGCTTGAA 


AGACAATCGC 


TATCGGGTAA 


TCAATATCTG 


9240 




TGTATTGTTG 


TATCTGTGTG 


ATAATTTTCC 


CTAAACGTTT 


TACCCCCATA 


TAAATTGCTA 


9300 




ACGTGCCACC 


ATTCACTAAG 


GAATTGACAT 


CCACTTCATT 


TTCTTCTGAA 


TCTTTAAAGT 


9360 


2S 


GACCTGTAGA 


AAATGTCACA 


CTTTTAGCAA 


CTGT ACG CAT 


TGTCAAACCT 


GTCTGCATAG 


9420 




TAGCAACTGc 


tGCGCTCGCT 


GATGTCACCC 


CTGGTACAAT 


TTCAAACGCA ATATGATGTT 


9480 




CATTTAGTAT 


GTCGACTTCT 


TCTTGCACAC 


GAC CAAATAT 


CGCTGGATCG 


CCACCTTTAA 


9540 


30 


GTGTAACAAC 


CTTGTTATAT 


CGACGCGCTG 


CTTCCACGAT 


ACAGTCATTT 


ATTTTTTCTT 


9600 




GCTGAATATG 


TTTTGCATAC 


GGCTTTTTAC 


CAACATCGAT 


AATTTCAGTA 


GTCAAATTCG 


9660 


3$ 


CATATTGTAA 


AATTAACGGA 


TTCACTAATC 


GATCATATAG 


AATGACATCC 


gCTTCACGTA 


9720 


TTAAAOGCTC 


AGCCTTTTTC 


GTCAAATAAT 


TCGGATTACC 


TGGACCCGCA 


CCTATCAAGT 


9780 




AAACCTTGCC 


ATATTCCTCT 


ACAGACATAT 


ATATACGTTC 


CCGTCTGTAA 


CTTCTACCTC 


9840 


40 


ATAAACATCT 


ACACAACCTT 


CATCAGGTTC 


TTGAACAATA 


CCTGTATTTA 


AATCAATTTT 


9900 




TTGATCGTGG 


AGCGGGCAAA 


ATACATATTC 


CCCACTCACT 


GTCCCTTCAG 


ACAATGGTCC 


9960 




TTGTTTGTGT 


GGACAGATAT 


TGTGAATCGC 


ATGAATTTTG 


CCACTTTCTG 


TTAAAAACAA 


10020 


45 


CCCTACCTCT 


TTGCCTTTGA 


CAATAACCTT 


TTTTCCAATT 


AGGGG TGTTA 


ATTCATCTAT 


10080 




AGTTGTCACT 


TTAATTTTTT 




CATGTATTAC 


ACCTTCTCCA 


CTTCAAAAAT 


10140 




TCTACGTGCT 


TGAGCATTGC 


TAGTTATTGC 


TTCCCAAGGT 


TCAGCTTCGA 


CTGCTTTTTT 


10200 


50 


AGCATCCATA 


ATGCGTTCAA 


ATAGTTCATT 


TTGTCTTTCT 


GGGTCAAGTA 


AGACTTCTTT 


10260 




TACATTTTCA 


AATCCAAGTC 


TTCTTAACCA 


TGGCGCTGTT 


CTTTCAGCAT 


ATATACCTGT 


10320 
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AGTTGTTAAA 


AATTCAGCTT 


TTTCAACTTC 


TGTACCACCA TTACCACCGA TATAGATTTG 


l (\aa n 

x w^i^t u 




GAATCCATTT 


TCAACTGAGA 


TAATACCAAA 


ATCTTTAACA 


CCTGATTCAA 


CACAACTTCT 


l n**nn 


s 


TGGGCAGCCT 


GATACACCCA 


TTTTGAATTT 


ATGAGGTGTA 


TCGATGTATT 


CAAATGTTTT 






TTCTAAACGA 


ATGCCAAGTC 


GTGTCGTGTA 


TTGCGTACCA AATCGACAAA ACTCTTTACC 


10650 


10 


AACACAGCTT 


TTAACTGAGC 


GTGTTTTCTT 


ACCATAAGCT 


GATGCTGAAC 


GCATACCTAG 


luvOU 


GTCTTCCCAT 


ATATTTGGTA ATTCTTCTTT 


TTTAACTCCA 


TACAAACCAA 


CACGTTGTGA 


1 C\*JA ft 




ACCTGTCACT 


TTAACTAGTG 


GCACATGATA 


TTTCTTAGCC 


ACTTCTCCTA 


GACGAATCAG 


1 A O ft ft 


1S 


TTGGTCTGCA 


TCTGTAACAC 


C C C CACGCAT 


TTGAGGTATA 


ACAGAAAATG 


TACCATCATT 


10860 




TTGAATATTC 


GCATGGTAAC 


w X X \_rW X lAUV. 


AAATCTTGAT 


TCTCTTTCAT 


CTTCATGATC 


10920 




ATGTGGATAA 


ACCATGTTTA 


AA 1* A AT A ftTT 
nn i/miAu x x 


GATTGCTGGT 


CGACATTTTG 


GACATCCACC 


10980 


20 


X X X X X X 4 *"» 


AAGTTTAAAA 


P A"TY5 TTT; AAf 


TTCTTTAGAT 


GTTTTTAAAC 

a. x x x x^*#^f%^» 


w X X X >»W\» X w X 


11040 




*FA f T w T w TY3fYlT , 'T* 

4/\Ji X iNlVaVJi X 


ACTATTTC3AT 




ATCAGTACAA 


CCACATATAC 


f7Af3 fTAOfT' I"!"! 1 

V>^WJV^1\JVJ XXX 


11100 


25 


*FGT , f3f5r , AAPA 


AAGTCATCTC 
GAATTCCCOG 




CTGCAATATT 

A \J Will Am^A A 


TGAGCAATTT 

x wnuww x a x 


GCGCTTTar , a 

WWVJVX x inv>A 


11160 


x» X X X X VI X X X X 


AGCCGTTACT 


' TPTTPAAPTYS 

x k« x x \p*mu ^ \j 


X X V» X /VUUJV \_ 


11220 




nil i x V*.v-o 1 i-i 


ATCGCATTTA ' 


CTATAGTACC 


TTTATCAACA 


CCATTACAAC 


CACAAATTGT 


11280 




X X X v«n X 


GCCATATCAG 


CAATTGATAG 


CGATGCCTCT 


TCTCCAC CTT 


TAGTAAGCAA 


11340 


30 


Tf3 AT A PA A f3T 


GTGTAATCTT 


CAGTGGATTC 


Accrrrrrrc 


ATCATG TT AT 


AAAAGCGTGA 


11400 




X>\»» X V_^fc X »wO 


ATATCACCAT 


ATAGTACTGC 


AC CAACTACA 


TT AC CG T CTT 


TTAAAAAGAT 


11460 


35 


TTTTTTATAG 

X * X X X Amvw 


TT ATT AT CAA 


CACTATTAAA 


TATTTCAATA 


CCTTTAATTT 


CTGCATTTTC 


11520 


TACAATTTGA 


CCAGCACTAT 


ACAAGTCACA 


CCCAGAAACT 


TTTAATGACG 


TAAATGTTGT 


115B0 




TGATCCCTTG 


TATC CGTTCG 


TTTCTTTATT 


X\?X lnnnlvA 




CTTTACCTTG 


llb4U 


40 


TTCATATAGT 


GGTGCAACGA 


GTCCATAAAC 


TTTGCCGTTA 


TGTTCTGCAC 


ATTCACCAAC 


i i Ton 
X x / uu 




TGCATATACA 


TTGCTATCAC 


TTGTTTGCAT 


CACATCATTG 


ACAACAATAC 


CACGATTAAC 


X x. / D \f 




ATCTAGACCT 


GATTCTTTGG 


CTACTTCTGT 


GTATGGTCGT 


ATACCTACTG 


CCATAACAAC 


1 1 eon 


45 


TAAGTCTGCC 


GGAATCTCGC 


GTCCATCAGC 


CAATTTAACA 


CCCTCAACAT 


CATCTTCTCC 


11880 




TAAGATTTCA 


GTTGTGTTGG 


CTTGCATTTC 


AAACTTCATA 


CCTTGCTTTT 


CTAGATCTGC 


11940 




TTT AAG CAT A 


TTTCCAGCTT 


TACGGTCTAG 


TTGCATTTCC 


ATCAACCATT 


CAGCTAAATG 


12000 


50 


TAACACCGTT 


ACTTCCATAC 


CTTGATCTAA 


TAAACCACGT 


GCACACTCTA 


AACCTAGTAA 


12060 




TCCTCCACCA 


ATTACAATTG 


CTTTCTTTTT 


AGTCTTAGCA 


ATGTTCATCA 


TTTGTTCAGT 


12120 
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GAATGCTTTA GAACCTGTCG CAAAAATCAA TTTATCGTAT GATACTTCAA TACCATTTGC 12240 

AGTAGTAACT GATTGATTTG CTCTATCTAC TTCAATTACA GGATCATTTG TAATTAACTC 12300 

GATACCATGT TCCTCATACC ACTCATATGG ATTCATAATT GTTTCTTCAA CTGTCATTTT 12360 

ATTTTGTAAA ATATTTGAAA GCATGATGCG GTTATAGTTT GGATAAGGTT CTTTACCTAT 12420 

TACOGTAATA TCATATAAAT CGTTGGCGCG CTCTAATATT TCTTCGATTG TTCGAATGCC 12480 

CGCCATACCG TTACCAATCA TTACTAGTTT TTGCTTTGCC ATAAAATATG CCCCTTTACT 12540 

CCATAATATT TATTTCAAAA AAAGGTATTA ATTTTTCGTT AGTGCTTTTA TATTTTCATT 12600 

GGAATCATTA AGCTTTCTAA TCTATCGTTA ATGATTTGCT TTAAAATTGG GTCGAAGTTA 12660 

ATTGAAGGTG TGAAGTGTAT ATCTGTATTA ATAACCATGT CATTCATTTG CTGCTTCACT 12720 

TTGTTAACAA GTCTTCCGTC ATATAAAAAT AATGGTACGA CAATCAATTT TTGATACCGT 12780 

20 TTCGAGATGC TTTCTAAATC ATGTGTAAAA CTAATCTCTC CATATAGCGT TCTCG CATAT 12840 

GTCGGCTTGC TAATTTGCAA ATTTTGAGCG CATATTTGTA ACTCTTCGTG TGCCTTAGTA 12900 

AACTTTCCAT TAATATTGCC GTGTGCAACA ACCATAACTC CAACTTGTTG TTCGTCACCT 12960 

26 GCTAATGCGT CACAAATACG TTGTTCAATT AATCGTCTCA TTAAAGGATG TGTGC CAAGT 13020 

GGCTCGCTTA CTTCTACCTT TATGTCTGGA TACCGTCGTT TCATTTCATG AACGATATTC 13080 

GGTATATCCT TGAGATAATG CATTGCACTA AAGATTAGCA ATGGTACAAT TTTAAAATGG 13140 

30 ... 

TCAACCCCAC TTTGAATCaA CGTCGTCaTT ACCGTCTCTA AATCCtGATG CTCACTTTCt 13200 

AAAAACGCAA TATCATAGTG ATGTATATCA TCTTTTACTA ATTCAGAAAT AAATGCTTCT 13260 

AACGCTTGa T TCTGTCGTCC GTGCCT CATG CCATGTGCAA CAATGATATT CCCATTCACA 13320 

35 

TTTACCAACC CTTTCACACG TATTGTATAC CAAATCATTT TGTTTTTGTG AAAAGAATCA 13380 

CATTATAATG TAAAATCAGG GAATTCCCTG ATGCCTGTAG TCATG CATAT T C CTT AT ACA 13440 

TTTTCCCTTT TTGTTAAATC AAAAAAAGCG ACCGATATAT GAATCCCTAC TCAACATTTA 13500 

40 

TTTGAGCAAG CATTAATATA TCGGTCGCTT GTAGTGTATA TTATTATCTT AAAATGGTGG 13560 

TTGGCCTAAT ATTGTTTCGT CAAAGCGCTC GGGTATCAAT ACTTTGCGCA TGATCACACC 13620 

45 TAAATCG CCA TCATCATTTT CATGTTCGCT GTATATTTCA TAACCTCTTT TTTCATAAAT 13680 

TTTAAGTAAC CACGGATGCA ATCTTGCAGA TGTACCTAAA GTAACTGCCG CTGACTTTAA 13740 

CGTATCTCGC AAAAATGCTT CTTCAACATA AGTAAGTAAT TGGCTACCAT AGCCTTTCCC 13800 

50 

TTCATACTCA GGATTTGTCG CAAACCACCA GACAAAAGGA TAACCCGAAA TACTTTTCAC 13860 

ACTTCCCCAA GG AT AT CT AA CCGTAATCGT AGATATAATT TCATCATCAA TTGTCATGAC 13 920 
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CCAATCAATA CCTAGTTCTC TTAGAgGCGT AAATGCTTCA TGCATGAOTT CTTGCAATTT 14040 
TTCTGCATCT T 14 051 

5 (2) INFORMATION FOR SEQ ID NO: 104: 

(1) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1885 base pairs 

(B) TYPE : nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 104: 

TAATCCTCAA CTTnGATTAT ATGGCTTGGG CGCATATGAA CTGCTTAGTT TAGTGTATGA 60 

CATTCATACA GTTCGCATGA CTATCATACA ACCTCGAATA GATAACTTTT CTACTGAAGA 120 

20 GTTACCAATC TCAAGATTAC TTCAATGGGG AACCGATTTT GTTAAACCCT TAGCCAGACT 180 

TGCTTATAAC GGTGAAGGTG AGTTTAAAGC AGGTAGTCAT TGTAGATTCT GTAAOATAAA 240 

GCATTCATGT AGAACACGTG CAGAATACAT GCAAAATGTG CCTCAAAAGC CACCACATTT 300 

25 GTTGAGTGAT GAAGAGATTG CAGAACTTTT ATATAAACTG CCTGATATCA AAAAATGGGC 360 

TGATGAAGTA GAGAAATATG CGTTAGAACA AGCGAAAGAG AATGATAAAA CGTATCCAGG 420 

TTGGAAGCTA GTCACGGGAC GTTCAAGGAG AGTGATAACT GATACAAAAG CAGTCCGAGA 480 

30 CAGGTTAGTT GAAGCGGGTT ATAAACCTGA AGATATTACA GAAACCAAGT TACTTAGCAT 540 

TACGAATTTA GAAAAATTAA TCGGCAAAAA AGCATTTTCT AAAATTGCAG AAGGCTTTAT 600 

AGAAAAGCCG CAAGGTAAAT TAACACTTGC TACCGAGTCT GATAAACGAC CAGCTATAAA 660 

GCAATCTGCT GAAGATGATT TTGACAAACT ATAAAAATTA AAAAGGACGG TATATAAACA 720 

TGAAAGCAAA AGTATTAAAT AAAACTAAAG TGATTACAGG AAAAGTAAGA GCATCATATG 780 

CACaTATTTT TGaACCTCAC AGTATGCAAG AAGGGCAAGA AGCAAAGTAT TCAATCAGTT 840 

TAATCATTCC TaAATCAGAT ACAAGTACGA TAAAAGCCAT TGAACAAGCT ATAGAAGCTG 900 

CTAAAGAAGA AGGAAAAGTT AGTAAGTTTG GAGGCAAAGT TCCTGCAAAT CTGAAACTTC 960 

45 CATTACGTGA TGGAGATACT GAAAGAGAAG ATGATGTGAA TTATCAAGAC GCTTATTTTA 1020 

TTAACGCATC AAGCAAACAA GCACCTGGTA TTATTGACCA AAACAAAATT AGATTAACGG 1080 

ATTCTGGAAC TATTGTAAGT GGTGACTATA TTAGAGCTTC AATCAATTTA TTTCCATTCA 1140 

50 ACACAAATGG TAATAAGGGT ATCGCAGTTG GATTGAACAA CATTCAACTT GTAGAAAAAG 1200 

GCGAACCTCT TGGCGGTGCA AGTGCAGCAG AAGATGATTT TGATGAATTA GACACTGATG 1260 
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TTGAGGTGTC AAOAATTTGA AATTTATOAA TATAGATATT GAAACATACA GCAGTAACGA 13 BO 

TATTTCGAAA TGTGGTGCCT ATAAATACAC AGAAGCTGAA GATTTCGAAA TTTTAATTAT 1440 

AGCTTATTCG ATAGATGGTG GAGCGATTAG TGCGATTGAC ATGACTAAAG TAGATAATGA 1500 

GCCTTTCCAC GCTGATTATG AGACGTTTAA AATTGCTCTA TTTGACCCTG CTGTAAAAAA 1560 

GTATGCATTC AATGCTAATT TCGAAAOAAC TTGTCTTGCT AAACATTTTA ATAAACAGAT 1620 

GCCAC CTGAA GAATGGATTT GCACAATGGT TAATTCAATG CGTATTGGCT TACCTGCTTC 1680 

GCTTOATAAA GTTGGAGAAG TTTTAAOACT ACAAAGCCAA AAAGATAAAG CAGGTAAAAA 1740 

TTTAATTCGT TATTTCTCTA TACCTTGTAA ACCAACAAAA GTTAATGGAG GAAGAACrAG 1800 

AAACCTACCT GAACATGATC TTGAAAAAtG GCAACAATTT ATAGATTaCT GTATTCGAGA I860 

TGTAGAAGTA GAAATGGCGA TTGCT 1885 

20 (2) INFORMATION FOR SEQ ID NO: 105: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH : 2656 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 
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(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 105: 

TAATCCTTAG TTCACTGnCA AATTTCAAAA CACCAGTTCC CTCTATCTGC ATCCATAGAA 60 

ACTGnATGTT TGTGTCAATA ACCGGATTAT ATTGTGATGn TGTTTGTAAC TCGATTAAGT 120 

TATCATCTTT CGAAAAATTA TCTACTACCA TTATTCAACC ACCTTTCCTT CGAATAAACT 180 

CCATTTACCA ACkCCACCAG TACCAAAGTT TCTAACTAAA AATTGATGTG CAGACGGGAA 240 

GTTATTACGT CTTAATACTT GTGTTGTATT ACCTGGTGTA TTCGATTTTA CTTCTAATAT 300 

CCAACCTGCA ATACCTTTAA AGTCTTTAGG AAAATCAGTA AATCGGTTTG ATTCTTCAGT 360 

AGTGATATAG AAATCTAAAC CAACGATTTT TAAATCTGAT AATTTTGTAA TACTCTTAGG 420 

GATATGTTCC CAATAACCGG CGTTTTGCGG GCAGAAATTC CATGCTCCOT TGTTTTTCTT 4 80 

ATTGAAAATG TCAATGACAC GTTCGAATTT AAGCATATTT CTACCTGTGC TGTTTCTGGt 540 

AAGTACTTGT CTTAGAGCAC CATTATAGTG TCCAGGCAGT ACATCCAAGA ACCACCCTGC 600 

ATCTCTAAAC GCTTTCGGTA ACGGGAAATC TAATGCATTT TGTGTGTCTT GaCGTATAGA 660 

TATAGTAATG ACCAACTTCC GTAATATCAC TTAGATATGC TGGGTTCTGT ATTGGTAACG 720 

GTTTAACACG TCCGC CTGAA TCAGTCATTG ATACTTGAGG TGCGATGTTT TTCAAGAATT 780 
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TAGTTACCCC 


GATTAGAAGT 


GCTTTACGTC 


CTGTTTCTAG 


ATCGTAATAC 


ATATCTAGAC 


900 




CCTCAGCCTC 


TTGGAAATCT 


CCTTTAAAGT 


TGTTATTCAC 


ACCGCCTATA 


TCGATGCGAC 


960 


5 


GTTTAAATAA 


CAATTCTTTC 


GTTTTGATAT 


CGAAGCCTTG 


TAAGTAGTTA 


GGGTTGGCTG 


1020 




TATTCGAATC 


ACCTGTATAC 


CAATATAAGA 


TACCTGCATC 


ATAAGTGATA 


CCTTGCATAG 


1080 


10 


GTTGTGTATC 


TGAAGTGTAT 


TCCATAGGTA 


TATCCATTTG 


ATACAATACT 


TTGTCTATAC 


1140 


CTTTATCAAT 


ATCGTCAGCA 


CTTCTAACCT 


CAACAAAGTT 


CAACGAATTC 


TTAAGTTGTC 


1200 




TTTCAGTGGG 


TTTATATTCA 


CGTCTAAAAA 


TCATTAAATT 


TTCTACCGGA 


TTATAAATCG 


1260 


IS 


CTGACGTATA 


TCTGTCGTTA 


AATATATTCG 


GCATGACATC 


TTGCATTTCA 


TTACCATAAG 


1320 


TTATTTCTCC 


AGTTCTATAT 


TGGAAACGTA 


CAAACTTGTT 


GTTTTTGTTA 


CTGTCCAATA 


1380 




CAGCTGAATA 


AATC CATAAT 


TCTCCATCAA 


TGTATCTATA 


CGCATTGTGT 


GTACCGTGAC 


144 0 


20 


- CGCCGTTTTT 


AACAAGCAAT 


CTATCAATAA 


ATTGTCCGTT 


GGG CTTCAAT 


CTAGATAACA 


1500 




TGTAATGATT 


ACCTGGACGA 


GCTTGCGTCA 


TATAAATAAT 


TTTCGTTCTA 


GGGTCTACCC 






AAAATGATTG 


CATTACTGCA 


TTTGTATATG 


GCGATAAATC 


AGTGATAAAT 


TCCGGTTCTT 


1620 


25 


GCTCTTTTGG 


TTCGAATCGG 


TATTCTGTCG 


CTCGATATTC 


TTTATAGTGT 


TCATCTACAG 


A© © \J 




CTTTCTCAAC 


cittttagtg 


AAAACATCTA 


GTGTTGAATA 


ATCATGATAC 


AAACGATCTT 






GCAATGTCTT 


ATGACCATAA 


CCTGTATTAT 


CAACGCGCGC 


GTCTTTTAcT TCGTTGATAC 


i Ann 

J. O \J\J 


30 


CGTCGCCGTT 


ATGACCTAGT 


ACCATGTTGC 


TAAATCGACC 


GTTTAAATAT 


GTTAAAAAGT 


iOOV 




CAGAGACGTT 


ACTTGTAACA 


TTTAAATGTT 


CATACTTTAT . 


TTGTTCTCCA 


TCATGTGCGA 


1 920 


3S 


ATACCTCTTT 


ATTTCTGTGG 


TATTCAAGAG 


AGAAATTAAA 


ATCCGTCAGC 


ATGTCTGAAA 


1980 


TAAGTTTAAA 


GTTATACTCA 


TTTTCATCTA 


CATATCTGTA 


GTCAAAGACT. 


CTACTTAAAT 


2040 




CTGTAATTAG 


TTTATTACTC 


ATGTTTTCCT 


CCTTTACTAT 


CCATAAAACT 


GATraATAATT 


2100 


40 


TTTAATAAGC 


TCATACATAA 


TAACTTCATG 


ACCTCTTTCA 


TTAGGATGTA ATCCATCAGG 


2160 


CATGCTAGAT 


TTTCTAAATG 


CTGGATTATA 


TGGTTTGAAA 


TAATCTGTGT 


GATAAGCATC 


2220 




ATATACTGGT 


ACATCCAATT 


CACTACAAGC 


CAATATCTGA 


GCATTGACAT 


AATCCTCTAA 


2280 


45 




1W !i*l**I**IV2*I , *F"*P"i* 
n\J 1 iluill J. 






ATCGTTGTAC 


CACTCATAGG 


2340 




GCATTGCCTA 


GTAGCTGTCA 


TTACAAGTAT 


TTTTGAAGCT 


GGATTATTTT 


TCCTGATAAC 


2400 




TTCAATTGCA 


GAACAAAAGG 


CGCCGTAAAA 


CGTTTTAGTG 


TCGGTTTTAT 


CAGTGCCTAT 


2460 


SO 


CGGTACGCCT 


GCCCAATAAC 


CATGTAACCA 


GTCATCATCT 


GTACCTTGTA 


ATATGATTAG 


.2520 




GTCTCCTCTT 


ATTTGCTCTG 


CTTGTCTaTA 


AATGCTGTTT 


TCTaCCGCTT 


CTTTACCTAT 


2580 
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CTTGCCTAAC ATTTCT 2656 
(2) INFORMATION FOR SEQ ID NO: 106: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4854 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 106: 

AAAATGAGGG TTCTAGCGGA AATTACCAAA AGCGTGGTTC ATACTATGGG CAGCGTAATC 60 

GTATTTCAAA AGAAAAAACA CCTAAATGGT TAGaAAATAG AGATAAACCT AGTGAAGAAG 120 

ATTCGGCTAA AOATAATAGC GTAGATGATC AACAATTAGA GCAAGATCGA CAAGCATTTC 180 

20 TAGATAAATT ATCTAAAAAA TGGGAGGAGG ACAGTCAATA ATGAAGCAAT TTAAAAGTAT 24 0 

AATTAACACG TCGCAGGACT TTQAAAAAAG AATAGAAAAG ATAAAnCAGA AGTAATCAAT 3 00 

GACCCAGATG TTAAGCAATT TTTGGAAGOG CATCGAGCTG AATTmACGAA TGCTATGATT 360 

25 GATGAAGACT TAAATGTGTT ACAAGAGTAT AAAGATCAAC AAAAACATTA TGACGGTCAT 420 

AAATTTGCTG ATTGTCCAAA TTTCGTAAAG GGGCATGTGC CTGAGTTATA TGTTGATAAT 4 80 

AACCGAATTA AAATACGCTA TTTACAATGC CCATGTAAAA TCAAGTACGA CGAAGAACGC 54 0 

TTTGAAGCTG AGCTAATTAC ATCTCATCAT ATGCAACGAG ATAC TTT AAA TGCCAAATTG 600 

AAAGATATTT ATATGAATCA TCGAGACCGT CTTGATGTAG CTATGGCAGC AGATGATATT 660 

TGTACAGCAA TAACTAATGG GGAACAAGTG AAAGGCCTTT ACCTTTATGG TCCATTTGGG 720 

ACAGGTAAAT CTTTTATTCT AGGTGCAATT GCGAATCAGC TCAAATCTAA GAAGGTACGT 780 

TCGACAATTA TTTATTT AC C GGAATTTATT AGAACATTAA AAGGTGGCTT TAAAGATGGT 840 

TCTTTTGAAA AGAAATTACA TCGCGTAAGA GAAGCAAACA TTTTAATGCT TGATGATATT 900 

GGGGCTGAAG AAGTGACTCC ATGGGTGAGA GATGAGGTAA TTGGACCTTT GCTACATTAT 960 

CGAATGGTTC ATGAATTACC AACATTCTTT AGTTCTAATT TTGACTATAG TGAATTGGAA 1020 

CATCATTTAG CGATGACTCG TGATGGTGAA GAGAAGACTA AAGCAGCACG TATTATTGAA 1080 

CGTGTCAAAT CTTTGTCAAC ACCATACTTT TTATCAGGAG AAAATTTCAG AAACAATTGA 1140 

ATTTTAAAAT GATTGGTGTA TAATGAATAC AAATCTAAAT CGTTTAAATG ATTGAAGACA 1200 

AGATGATCTA ATCAATATTA CACAGAAAGC CATTGTTTGA TGAGAATATG GTTAATAAAT 1260 

TAGATGATTA CTACTTCATT TATGGTATTT GTAATGAATA CCCGGATCAA GACCGTTATC 1320 
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CTCGTCCCTT GTATAGGGGC GGGATTTTTT GTTTTTTTCA GACATAAATG TTTGTTGGTG 1440 

TCATAAATTC CCTGTTTATT GTTAATAGGT TTAATGTTAA AACGATGATT GTTGTTCAAT 1500 

TTTTTAACGA GGTCAGATAA AAGTATTTAT AAAGCAAATA GOAGGGTTTA ACATGGAACA 1560 

AATTAATATT CAATTTCCAG ATGGTAATAA AAAGQCGTTT GATAAAGGTA CTACTACTGA 1620 

AG AT AT AG CA CAATCAATTA GTCCTGGATT ACGTAAAAAA GCTGTTGCCG GCAAATTTAA 1680 

CGGGCAACTT GTAGATTTAA CTAAACCGCT TGAAACTGAT GGATCAATTG AAATTGTGAC 1740 

ACCAGGTAGT GAAGAagcGT TAGAGGTATT ACGTCATTCT ACTGCACATT TAATGGCACA 1800 

CGCGATTAAA AGGTTATATG GTAATGTTAA ATTTGGTGTA GGTCCTGTAA TAGAAGGTGG 1860 

ATTCTACTAT GACTTCGACA TTGACCAAAA CATCTCATCT GATGACTTTG AACAAATTGA 1920 

AAAAACAATG AAACAAATCG TTAACGAAAA TATGAAAATC GAACGAAAAG TGGTTTCAOG 1980 

20 AGATGAAGTG AAAGAGTTAT TCAGCAATGA TGAATACAAA TTAGAATTAA TCGACGCGAT 204 0 

TCCTOAAGAT GAAAATGTAA CATTATATAG TCAAGGTGAT TTTACTGATT TATGTCGTGG 2100 

AGTTCACGTT CCATCAACAG CTAAAATTAA AGAGTTTAAA CTATTATCTA CAGCAGGTGC 2160 

26 ATACTGGCGT GGAGATAGTA ACAACAAAAT GTTACAACGT ATATACGGTA CTGCTTTCTT 2220 

TGATAAAAAA GAATTGAAAG CACATTTACA AATGTTAGAA GAGCGTAAAG AACGTGATCA 2280 

TCGTAAAATT GGTAAAGAGT TAGAACTATT CACAAATAGC CAATTAGTTG GTGCTGGTTT 2340 

GCCATTATGG TTACCTAACG GTGCAACAAT TAGACGTGAA ATTGAACGTT ACATTGTTGA 2400 

TAAAGAAGTT AGCATGGGAT ATGAC CACGT TTATACACCA GTACTTGCTA ATGTTGATTT 2460 

ATACAAAACA TCTGGTCACT GGGATCACTA TCAAGAAGAT ATGTTCCCAC CAATGCAGTT 2520 

AGATGAAACT GAATCTATGG TATTACGTCC AATGAACTGT CCACATCATA TGATGATTTA 2580 

TGCqAATAAA CCACATTCAT ATCGTGAATT ACCTATCCGT ATCGCTGAGC TAGGAACGAT 2640 

GCATAGATAT GAAGCAAGTG GTGCTGTATC AGGATTACAA CGTGTTCGTG GTATGACTTT 2700 

AAATGATTCA CATATCTTTG TTCGACCTGA TCAAATTAAA GAAGAATTCA AACGCGTTGT 2760 

AAACATGATT ATTGATGTGT ATAAAGACTT TGGTTTCGAG GATTATAGCT TTAGATTAAG 2820 

45 TTATAGAGAC CCTGAAGATA AAGAAAAGTA CTTTGATGAT GATGATATGT GGAATAAAGC 2880 

TGAAAATATG CTTAAAGAGG CAGCGGATGA GCTTGGCTTA TCGTACGAnG AAgCGATTGG 2940 

TGAAgCGGCA TTCTATGGTC CGAAACTAGA TGTTCAAGTT AAAACAGCGA TGGGTAAAGA 3000 

50 AGAGACATTA TCAACAGCAC AACTTGATTT CTTATTACCA GAACGTTTTG ATTTAACTTA 3060 

TATTGGTCAA GATGGTGAAC ATCATCGTCC AGTTGTTATT CATCGTGGTG TTGTATCAAC 3120 
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AGCGCCAAAA CAAGTTCAAA TCATTCCAGT TAACGTTGAT TTACATTATG ATTATGCGCG 324 0 

CCAATTACAA GATGAATTGA AATCTCAAGG CGTTOGTGTA AGTATTGATG ACCGTAATGA 33 00 

5 AAAAATGGGT TATAAAATCA GAGAAGCTCA AATGCAAAAA ATACCTTATC AAATCGTAGT 33 60 

TGGGOATAAG GAAGTTGAAA ATAATCAAGT GAATGTGCGT CAATATGGAT CG CAAGACCA 34 20 

AGAAACAGTT GAAAAAGATG AATTTATCTG GAATCTAGTT GATGAAATTC GTTTGAAAAA 34 80 

10 

ACATAGATAG ACAGTTGTCG CAATAAAATG CTTTAAAACT TTTATTGCGT ATCAAGTTTT 3 540 

ACAGGGTTGA TTATGCGTGA TGAATCCTGT ATATTACAAG TTAGTTAAAA TATTAAATTG 3600 

1S AGTTAGAGGT TGCATGTTTA ATTAGTAACT TGTCAGAAGT ATTTATGGTA CATAAGTTGA 3660 

ACAAGTGAAA GGTAAAGATG CCGAAATAGA TATAAACCAT AAATTATATC TATTGGOACA 3720 

GTTTTCGAAT AGGAACTGTA CTGTCACAGA ATGTGATGTG CTACCTTATA TAGATAATTG 3780 

20 CCAAAGTGGT TGCATATCTT AAAGGTATGT AGCCACTTTT TTACTTTTAA TATCACTATG 3840 

TTCTGTAAAA AAGGGTATGA AAGTGAATAA AGGTTATTTA TTTCTTGGCC TCTAAAACAT 3900 

GGAAAGGGAG CTTATATGTC AAAAGTTCAA AATGAAAGTA ACAATGTTGT CAAAAGGGGA 3960 

25 CTTAAAGATC GTCATATTTC TATGATTGCG ATTGGGGGTT GTATTGGTAC AGGTTTATTT 4020 

GTAACTTCTG GTGGAGCAAT TCATGATGCA GGTGCTTTGG GTGCATTAAT AGGATACGCA 4 080 

ATTATCGGAA TAATGGTATT TTTCTTAATG ACGTCACTTG GCGAAATGGC TACGTATTTG 414 0 

30 

CCAGTATCAG G TTCATTT AG TACATATGCT ACAAGATTTG TTGATCCATC TTTAGGGTTT 4200 

GCGCTTGGTT GGAACTATTG GTTTAACTGG GTAGTGACTG TAGCAGCAGA TATTACGATT 4260 

GCAGCACAAG TCATTCAATA TTGGACACCA TTGCAAGGCA TACCCGCTTG GGCATGGAGT 4320 

35 

GCGTTGTTCT TAGTTATAAT TTTTAGTCTG AATTCGTTAT CAGTTCGCGT CTATGGTGAA . 43 80 

AGTXjAATACT GGTTGGCATT GATAAAAGTG GTT ACAGTTA TTGTTTTCAT TGCAATTGGT 444 0 

TTATTAACGA TTGTCGGAAT CATGGGTGGT CATGTTGTAG GATTCGAAAT ATTTAATAAA 4500 

40 

GGTGAAGGTC CAATTCTTGG TGGCAACTTA GGAGGAAGTT TGTTATCAAT TCTAGGTGTA 456 0 

TTCTTAATCG CTGGTTTCTC ATTCCAAGGT ACTGAGTTAA TTGGTATTAC GGCTGGTGAA 4620 

45 TCAGAAAATC CTGAACGTGC TGTGCCGAAA GCAATTAAAC AAGTATTCTG GAGAATTTTA 4680 

TTATTTTACA TTTTAGCCAT TTTTGTTATC GGTATGTTAA TTCCTTATGA TAGTAGTGCA 4740 

TTAATGGGGG GTAGTGATAA TGTAGCAACG TCTCCATTCA CATTAGTGTT TAAAAATGCT 4800 

60 GGATTTGCGT TTGCAGCATC ATTTATGAAT GCAGTCATTT TAACGTCTGT GTTA 4854 
(2) INFORMATION FOR SEQ ID NO: 107: 
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(A) LENGTH: 2488 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 107: 

10 ATCAAAAATT GATTGTTTTC nATTTTTTGT TTCAGCGCGG GATCTTTTAC GTCTTTTGTG 60 

AAAACGaTTT TATTATTAAC TACTTTTACT GGATAACTTT TGTATGTCGA GTCAGTAGCA 120 

TTTTTTCTAT CGTTTGTAGT TGTGTCATAT TCACCAgTTA TTTTATGTGT GTTCTTATCT 180 

ACCTTTAACA ACATACGGTC TTCTTTTAAA AGCTCATCTG ATCCAACAAC TGAATAAGAG 240 

GATTCTATAT ACCATGTGTC TTGATCATTA TTTTCATAAT GGGGATTATC GTGACCATCA 300 

ATTTCATAAA GCGTTTCTAA GTTTTTAATA GGATACGTAC TTAGTACTTT TTTAAGACCA 360 

TCTTTCAAAT GAATTTGTTC CCACTTCATT GCCAAAAACA TATCGCCACT GACTACAATT 420 

GAAATAATAA TAATTGCTGC TAAGTTTAAC CAGAAAATTT TATGTGCTTT CATACATTCC 480 

CACCGTTTCT CAAAATACTT CATTAACACT ATAATAATAT ATTTTGAAAA ATATTTACAT 540 

CAGTATTAAA GTGAATATCA AATTTTAAAT TTATGAAAAT AATAGATATT TATAAAAAGC 600 

GGAAAAGAGA TACAATAAAA AACTGCATGA CGTTTGAGAC GTCACACAGT GTAACTAAAA 660 

ATTTAAAAAG TTGTTGCTAA TTTTTCAGCA TTATTAATAC TAGTTGCTTT AATTTCTTCA 720 

30 

GTCTTATGAG GTTCAG CATT GTGTCCTTCA ATAATGATTG TTTCATATGA TGGCACACCT 780 

AAGAATGTCA TAATTGTTCT TAAATAACGG TCACCCATTT CAAAATCAGC AGCAGGTCCT 84 0 

3S TCAGTATAAT ATCCACCACG TGATTGAATG TGTAATACTT TTTTGTCAGT TAGTAAACCT 900 

TGTGGTCCTT CAGCAGAATA TTTAAAAGTT TTACCTGCAA TTGAAATAGC ATCAATATAT 96 0 

GCTTTAACTA CAGGTGGGAA AGAAAGGTTC CACATAGGCG TTACAAATAC ATATTTATCT 102 0 

40 GCACTTAAAA ATTCTTCTAA AATGTCACTC AATCTTGAAA CTTTCATTTG TTCATCATCA 1080 

GTTAACGTTT CGCCATTACT CATTTTTCCC CAACCAGTTA ATACATCTTT GTCAATAACT 114 0 

GGAATATAAG TTTCArATAA ATCAATATGT TTCACTTCAT CATCAGGATG TTGTTGTTGA 1200 

TATGTTTCGA TAAATGCTTT ACCAGCCGCC ATAGAATTTG ATACCAGTTC ATTAAAAGGG 1260 

TGTGCTGTAA TATATAATAC TTTTGCCATT TGAAAATTCT CCTCTGkTTC TGTTATTTTC 1320 

TTAAGTATAA TTATTATACT CGATATAAAA TTTAATATCA ATCAAAATAT TCAAATTACC 13 80 

ATCATTTTCT TCATCTATAT nTGGCAGTAC TACTAAAGTA TGAGTGCATT TAATTATGAa 1440 

ATAGTTGATT TaGAATAtAT ACTTAATACC CAAAATATAT GAAGGATGGA TGCCACTATG 1500 
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ATTATTTATA TAOATGACAT TCAAAAATGG TTTAACCAAT ATACCGATAA ATTGACACAA 1620 

AATCATAAAG GACAAGGACA CTCAAAATGG GAAGACTTTT TTAGAGGGAG TCGGATTACT 1680 

GAGACTTTTG GTAAATATCA ACATTCACCA TTTGATGGTA AGCATTATGG CATTGATTTT 174 0 

GCATTGCCAA AAGGTACACC AATTAAAGCG CCGACGAATG GTAAAGTAAC ACGTATCTTT 1800 

AATAATGAAT TGGGCGGCAA GGTATTACAG ATTGCCGAAG ACAATGGAGA ATATCACCAG 1860 

TGGTATCTAC ACTTAGACAA ATATAATGTC AAAGTAGGTG ATCGAGTCAA AGCAGGTGAT 1920 

ATTATTGCAT ATTCAGGCAA TACAGGTATA CAAACGACAG GCGCACATTT ACATTTTCAA 1980 

r5 AGAATGAAGG GTGGCGTAGG TAATGCATAT GCAGAAGATC CAAAACCGTT TATCGATCAG 204 0 

TTACCTGATG GGGAACGTAG CCTATATGAT TTGTAGTTAT AGAAGGGTGC CCGCAGTCTA 2100 

AAAAATTAAG CAATCATTGT GTGAGTATGA TACTTACATA ATGGTTGCTT TTTTCAATGA 2160 

AAATCGTAAT GCTAAGTCAT ACTTGTTTGA TTTAGATATT ACTTAAAATG TAAGACAAGG 2220 

TTGTTAGCAT TGGCAGTGAA ATATCGCACA TAAAAAACAT TATTGTCACA CTAGAAAATA 2280 

GTTGTGCACT ATATCAATTT TCTGTATAAA AGTTTAATTC TGACAGTAAT GTAAACGTTT 234 0 

ACAATTTATG ATTGACATTA ATAATGACTG AATATATGAT TTATGTAAGT ATTTGTGCAA 24 00 

CGTTTTCACA AAGTGTATTG CACaAyCAAA CTGtAAACaA aGTATGGGGg GCCATAACAT 24 60 

GGCAGAACTA AGTTAGAGCn TATTAAAA 24 8 8 
(2) INFORMATION FOR SEQ ID NO: 108: 



20 



25 



30 



(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 4 0 93 base pairs 
3$ (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 108: 
TTTTCTTTAT TTCAAmCTGT ATATTaATGA TGTCACTTCA TTTGATACGA TTCTTGATAA 60 
CCTATTCAAA ATTCCGCCAA ATAACATAAA TATTATATAA ATGCCGATAC TTTTAATCAT 120 

4$ 

TTTCTACTTT TTCTTCGATA CGGAAACTTG TTTTCGAATT GAACACTTCA CCAGCTTTTA 180 
AAATTGACGG TGCTTTTTCA C CAT ATAAAT TAATATCATT TGGTAAAAAT TGTGTTTCTA 24 0 

60 ATGTAAAGCC AGAATGTGGT TTATAAATAT TAAATGGACT ATCCCACTCA TCAGGCTGGT 300 
TAAAAGTAAA GAACACAACA TGAGGCATAT CTGTATCGAC CTCTAACATA AATTCATGAT 360 
TTTCAACATA CATTTTATGT TCACCAACTG TAAATGGGTG ATCGAGACCA CCAAAACGTG 42 0 
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TATCTTCAAA CACTTCATGT AAATCTAOAA TATCACCTGT AACAATATTT CGCTCATCTA 540 

ATACATACAT ATCTAATTGA TTACTTGAAA TGCGATGATT ATCAACGACA TTATTATCTC 600 

5 

GATTCAAATT GAAGTACACA TGATTCGTAG GACTAAACAA TGTGTCTTCT GATGCAACTG 660 

CTTCGTATTC AATCGACCAT TGGTGATCCG CATCATAAAT ATGTGTAATC GTCACATCGA 720 

TATCACCCGG GAAATGATCA TCAGCTGATT TCAACACCGT CTTAAATATA ACTTTAATTT 780 

10 

GAGCAATTTC ATTTCTAATT TCATAATCAA ATAACTTATT GTCCAAACCA TGACATCCAC 840 

CATGTAAATG ATGTTCACCG TTGTTTTTTT CTAACTGATA TTCTTTACCT TTCAACTTAA 900 

15 ATTTAGCATT ATCAATTCTA CCGCTATATC TTCCTATAGA AGCACCAAAT TTAAAAGGAT 960 

TACTATGATa AAATTCATCC GCTTCAACAA CATTTCCAAG AACAATATTA TTATCATGAT 1020 

ATTTCCAAGA CACTACTCTT GCTCCATAAT TCGTAAAAAT AATTTTAGTT TCATCATTAT 1080 

20 

CAATTTTGAT TAAATCTACA CCTTGTCTTT GGTGCTCAAC TTCAACTATC ATTTTTACTT 1140 

CTCCCTTCTA ACCACAAGTG TTCAAGCTCT GCTGGGTAGC AACATTACTA AAACACCTAC 1200 

AATACAAATG ATTGCACCGA TAACATCATA TTTATCTGGC ATTTGTTTAT CTACGACCAT 1260 

25 

CGCAAAAATC AAACTCATGA TGATAAATAC GCCACCATAT GCTGCATATA CTCTTCCGAA 1320 

TGATGGAAAT GATTGAAATG TCGCAATGAC ACCATATAAC ATGAGTATCG CACCGCCTAT 13 80 

30 TAGCCCAACA AGTGAAGACT GTCCTTCCCT AAGCCACAGC CAAATCAGGT ATCCCCCACC 1440 

TATTTCACAT AAGCCAGCTA ATATAAATAT AAAAATCGGA TATAACATGA AATCACTCCA 1500 

TCACACATTT GCTATCAATA ATCTATCGGC TACATATCAT TTGTTTACAT TTCTTCTTAC 1560 

35 TTCACATTCC CATTTTAAAA AGTTCGTTTT CACATTCATA TTGTACACTT TTTTAGACAT 1620 

TATTCTATAG CTAAATATAA AAAAATAAGA GTAACACGCT TTCATCATCA TTTTATATGA 1680 

TAAATGTGTG TCACTCTCAT CAATTTTATT TTTTAAATAC ACGTTTCATT GAATTAAATA 1740 

40 

AGCCACGTTC AAATGTAAGT ACTGAATCTT TATATGTTTT AATTGCAATC CATATCAAGA 1800 

CAGCTACCAT TACAATTGAG ATTAAAGAAC TTAAGATGAC CTCATATATT TGAAGCCCTG 1860 

AAGTTTGAGC GCGTACAACT AATTGAAATG GCGCTAAAAA CGGAATATAA CTTGTGATTA 1920 

45 

AAGCAAGTTG TCCATCAGGA TTATTTATCG TGAATATCGC GATATAAAAT GCAATCATAC 1980 

CAAGTAATGT CAGTGGCATC AAAGATTGAT TTAAATCTTC TATTCTAGAT GTTAATGATC 2040 

SO CGAGGATGGC TGCAAGTAAT ACATACGCCG TAATTCCAAC AATACTACTT ATAATTCCGA 2100 

CAATAATAAT TTGCCAAGAC AATTGATTCA TTTCCACGTT AAAACCTTGT AGCAAGTCTT 2160 

TTAAGTCAAA GGCAAAAATG CATATAACTG CCATCAATAC AATTAAAATA ATCTGAGTCA 2220 

55 



625 



TAATAATCAT TTCAATGACA CGCGATGTTT 
ATGCATAATT TAAAACAATG AAGAACATTA 
5 TGAAAATCTT TTGTCCTTCT GATACTTTAT 

CAACTTTACT TTGTGCTTGT AATTTTTGTA 
CTACCATATT TGTTTGAATA GCTGTAAGCA 

10 

TTACTCGCTT CTCACTAATG ATTGTCCCTT 
TATAAGCTTT ATCAAGTTTA TGTTTTTTTA 

JS TAGTAAACTT AGCATCACTA TGAAATGTAT 

GTTCATTCGG TGCTGCTACA CCAATTTTAT 
TATCAATGTT AGATAGGCCA ATCATTAAGG 

20 ATTTAGCTTT AATTTTTTTG ATATATGTCA 

TTGCCACCAA CCTTCTCAAT GAATATATCT 

TTAACATAAC CTTGATGTGC CACAACTTGA 

25 

ATCGTCAACT GAAGACCTTG CTTCATGTTT 

AAATCTGGTA GTGTTGTTTC TGATTCAATG 

ACATGATTGA TATCACCAGA AACAACAAGT 

30 

CATAATTCTT CAACATG CTC CATACGGTGA 
TTTAAGTCTT TAACTGCTTc TTTTAATAAC 

35 GGCTCATCTA ATATTAGTAA TTCTGGTTTA 

TGTTGATTCC CTTTTGATAG ACTATCAATT 
CGCTCAAGCC AATACGATAT TTG CTGTTGT 

40 GCCAAATATT TCAATTCTTC TTCAACTGTC 

AAATAACCAA TACGATTGTA CATTGTTTTA 
CCTTCAGTTG GTTCACTTAA GCCTAAAATC 

45 

TTTCTTCCTA GAAAACCTAA CATTTTACCT 
GCCGTCATCT TGCCAAAACG TTT CGTAACA 
60 CTAAAAAnAT ATGTATTTAT CTTAATATAA 

TAAAATGAAT TTATTTTTAA AATTTCTGAA 
ATGTTAAGTA TCATTAG CAC TAGATATGTT 

55 
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TCTCACTAGC AATTTC CAT A GCTATTTGAG 2340 

GAAAGATAAT GCCATmaGcT AAAGCATAGT 2400 

OGACTTCATC ATTAGAAATC ACCTTATTAT 24 60 

AGTCTTCTTT GTTGATATTT AATTCCCCGG 2520 

GTGCTTGTAC TTTTTGTGAA TCTTCATGAC 2580 

GTAACGTGCG ATTTTGATTC ACCTTGATAA 264 0 

CTTCTTTTTC AGCATCTTCT ATAGAAACTT 2700 

TCGCCTGTTG CTTGAAAACC TTATAGATTT 2760 

CTGGACCATC ATCAAACATG TTAATAATCT 2820 

CAG CAAT AAT AATCATAAAA ATTACAAATG 2880 

AAGTAAATGT CGCCCAAAAC TTATG CATCC 2940 

TGTAATGATG GTTCTACAAC TTGGAATCGT 3000 

TAAATATCTT TGGCTAOGTC TTCATTCTCA 3060 

TCACTATGAA TGATGCCTCT AATGTTTGTT 3120 

ACAACTTTCT TGTTACCATT AGATGCACGT 3190 

TGACCTTTAT CTAAAATACA AACATCATCA 324 0 

GAACTATAAA CGATTGTACT GCCCCAATCA 33 00 

TCAACATTAA CTGGGTCTAG ACCACTGAAA 3360 

TGTAACATAC TTGCTAACAG CTGAATTTTT 3420 

CGTTTTTTGC GGTTTTCAGT AATATCAAAA 34 80 

ATTTCTGTTT TTGACATTCC CTTTAAAGTT 3540 

AATTTC C CAT GTAAACCGCG TTCTTCCGGT 3600 

TCTAGTTTTT TACCGTTATA CGTrrTGTGT 3 660 

ATACGAAATG TCGTTGTTTT ACmTGCACCA 3 720 

GATTCTAACT TTAATGAAAT ATCATTTACT 3780 

TGTTCAATTA CAAGTCCCAT ACTTTGCCTC 3 84 0 

CATTTCCATT CTCTATAAAT GCAATATTTT 3 900 

ATTGAAAAAT TTAAATAGTG CCATTTTTGC 3 960 

TTTTCCATGC CTTTATTGCC TTATTTGTAA 4 020 



626 



EP0 786 519 A2 



CTTnCCGGTG TTT 

(2) INFORMATION FOR SEQ ID NO: 109: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 17846 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 109: 



75 


TGCCAAAJL. 1 A 


CCTTTTGACA 


GTCGTTGCTG 


TACTTCAGGA 


TGATCAATCA 


CATATnTTAC 


60 




x 1 1 ATCAAAT 


AGGGCATCTT 


CATCATTTTT 


AGTAATTAAA 


TAACCATTGA 


AATCTGAAGT 


120 




AATCAGTTCG 


TTAGGTCCAT 


ATTTAATATC 


ATAACTAATA 


ACTGGAACAC 


CATGTGCTAA 


180 


20 


AGATTCAAGT 


AGCGCTAAAG 


AGAAACCTTC 


CATGTTACTT 


GTTATTAAAC 


TCAAATAGGC 


240 




ATCGCTATAT 


TCTTGGTCTA 


GATTGCTTAA 


AAAGCCGCGT 


AAGTAAACAT 


GATTTTCCAA 


300 


25 


TC CATATTTT 


TGTATCAATT 


CATTTAATTT 


TTTACTTTCA 


GAaCCAAAAC 


CATACATATG 


360 


AaGCTCTATT 


TTTGGGACAT 


ACGATACTAA 


GCGTTTAATT 


AATTCAATTT 


GTTGATGTAA 


420 




TTGTTTTTCA 


luAA X AAL 


C5AGCAACGGA 


AATTAATTTA 


ACACTGCGCT 


GATCTAATGT 


480 


30 


x ivjua\. xuv x 




TTTCACTATA 


ut v_\jAL_A\j\jA 


A I A 11 AAvJAA 


CTQGAATAC3T 


540 




ATGGTTAATA 


^wVj J. x x x x win 




X X VjV* X X V^ri 


VJ X AV3tnrlrlV»V? A 




600 




ATATCGAGAT 


AAATTTTCAA 


ACATCGCTTT 


ATATACATTT 


TTAAATGGCG 


ATGAATCTAA 


660 


35 


TGCATCAATA 


TTTTTAATGT 


GTGTACTGTG 


AAGCACAGCT 


ACTACTGGGA 


TTGACTCAGG 


720 




CGTTAAGTTG 


AAAATAGGTG 


CTGTGTACAC 


ATTACGATCA 


CTGAAAAATA 


AATCCCCATG 


780 




TTGATATAGT 


TGTTTAATGA 


AAAATGCGCC 


TAATTCCGTT 


TCATTATTAA 


AGAAATATTG 


840 


40 


TTTTGTTAGCA 


TAGTAAACAA 


TAATTTTTTG 


TACTTCTGGT 


TTGCCATCCT 


TGTAAGAAAA 


900 




ATACTTTTCT 


AATTTTGTGT 


CACCTTCTGG 


ATTATAGAAA 


AATTCACATA 


ATGTTTGTTG 


960 


45 


TTTATCAACA 


AGAATCCTAC 


TACAACTTAA 


AAAGCCACGC 


ACATCATAAA 


AATCACGTTT 


1020 


TACTTtTCGT 


CTTTGACTAT 


CAAAATGATT 


TACATAATCT 


AATATACGAT 


ATTTAGGATC 


1080 




TTGAAAATGG 


GCATACATTA 


AGAAACGCTC 


TTGATCATAT 


ATTCTAAAGT 


CATGACTATT 


1140 


SO 


TTCAACATGT 


TTTAAAGTAT 


AATGACATTC 


ATCAGTCCAA 


TACGACAACC 


AGTCAAATGG 


1200 




TTCATTGCGT 


TCTAAATATG 


TTGCTTCTTG 


GAAGAAATCA 


TACATATTAA 


TATAGTCAGA 


1260 




ACTAGTAATA 


TAATTTTGGG 


CATTTCTATA 


TAAATATCTA 


TTCCATGACA 


GAAATACACA 


1320 
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is 



CCCAGTTAAA TTAACACCTA AACTATTACC TACAAAATAA TTCATTTACA ACACCACTTA 1440 

TATCTATTTT TTATAATTAT ATCACATAAT ATTTAATTAC TTCTTTTAAC TGGAAGATGT 1500 

GTTTATTTAT AAAACAACAA ATTTTGATAT TTATAATGAT AGTAGTTATT CAATCAcTAC 1560 

GACCcAATAT ATCATkGTAG AG CTTAGGAT ATTGATTTAT GACTCAGGCA CATCAAATGa 1620 

GAgGATTTAT AAArGAGATA TACAACTCTA GAAGGTATAA TAAAAACGCG CAACTAATGT 1680 

TACGCGTTTG AATTAATCAT ATGATATTAT TTGCGATACT TT AATTT AG C GAAAgcATCA 174 0 

TGTTGATGGA TAGACTCTTC ATTACGACAT TCGATATCGA AACCGTCTAA CCAATCAAAT 1800 

TCAACTAAGT CCGCGGCAAT TAAACGAATT AAGTCTTCGA CAAAACGTGG ATTTTCATAT 1860 

GCACGCTCTG TCACACGTTT TTCATCAGGA CGTTTTAAAA TAGGGTATAG AATTGAACTT 1920 

GCATTAGCTT CCATTGCATC TAAAATTTTA TTTTTATAGT CATCAACTAT GTCTTGATCT 1980 

20 TTATTAATAT ATGTTTTAAC AGTGACAACA CCACGTTGGT TGTGCGCTGA ATACTCACTT 2040 

ATTTCTTTTG AACAAGGGGA TAGCGTTGTG ACAGTTGCTT CAATAGTAAG TTCTTTACGT 2100 

GTAnCTTTAT CACCGTCAAT TGCTAATCCA TAAGTGACAT CGGCATTACC AACTGCTTTA 2160 

2S 

ATATTTGTGG TTGGACTATA GCGATCAAAG AACCATTTCC CAGAAACATC AACGCCTGCC 2220 

GCATTTTGTT TCATATTCGT TTGTAAAGTG CGTAACACCT GATAAAGTGT ATTAAATTCA 2280 

AGTTCAATAC CATTATCATA GTGCTTTTCA ACACTTTCGA TTATACGGCT CATATTAATA 234 0 

30 

CCTTTTTCGT CTTTTGTTAA ACTTGTTGAA AAACTAAATG TGCCAGCTGT TTGATACTGG 24 00 

TCAACAAGTA CAGGGTACAC TAAGTTTTTA AT AC CAACTT CTTCTATTTC AAATAAAAAA 2460 

3S TCTTTATGTG TACTTTGTAA ATCTGTCATT TCGTTCTTAG TAG TAGGTTT CGTGCCTTCA 2520 

ATAGGATCTA CGGAACCAAA GTGTTTCCAA CGACCTTCTC GTGTCGATAA ATCAAATTCA 2580 

GTCATTTTTT TCCTCCGTTA AGATTTAAAG TGATATGTCC AATATGGTTC GACTGTTAAA 264 0 

40 AAGCTGTGTT GTTTACCATC GATTTCAGGA CTTGCTAATT GTTTTAAAAA TGGACCTGTT 2700 

TGAGAAGCAT GTGCTTCAAA TGCCTTAATT TTAAGTTCTT TAAAATCTGT AATAT CATTT 2760 

TGAATATCAG GTTCTCCAAG AGCTTCGGTT GCATCATTAC TGAACGCAAC TAAAGTTAAA 2820 

45 

CGAGGGCGTT CTTCTTTAGG CATGCGTTCA ACCGTTCGAA TTACAGCGTC TGCTGTTGCT 2880 

TCGTGATCAG GATGTACTGC ATATCCAGGA TAAAATGAAA TAATCAATGA TGGATTTGTA 2 94 0 

TCATCGATTA AAGATTTAAT CATACCATCT ATATGTTCAT AGGGTTCAAA TTCGACAGTT 3 000 

TTGTCACGTA AACCCATTTT TCTTAAATCA GTAATACCGA TAACTTTACA AGCTTCTTCT 3 060 

AGTTCACGCT CACGAATACT TGGTAATGAT TCGCGTGTTG CAAATGGGGG ATTAC CTAAA 3120 



50 



SS 
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TAATTTGCTA ATGTGCCTGC AGATGAGAAG 

AATACATGTC TTTCGTCAGT CATGTTGATG 

5 

AATTTGAAGT GCTGCAGCGA GTTGACCTTC 

ATGCTCATTG ACCTCAAAAT GCGTTAGACC 

TTTAAGACCA ATGCGATAAG GTTCTTTATT 

10 

TATTTGTATG TTTCTTAAAA AAGTACCAGC 
ATAGGCCCCA TTTGTCGTTT CAACATGCAG 

f 5 TAAATCTATA ACTTCTTGTT CTTTAATTGG 

TGTGTTTATC TTTCTATTTT ACTAAAAACT 
TTTATAAATT AATTTTCATG AAGGGTAATT 

20 TTTTTTACTT TTAAAAATCA AAAATTTGTT 

GATGCTATAT TAATGGTGTA TGAATGAATT 
GAGGCATGTA AACAATGAAA GTATTAAACT 

25 

TTGCATGTGA GTTATATAAA GAG ATGG CAT 
CTGGTGGTAC AATGACAGAT TTGTATGAAC 
TAAACGTAGA CAATGTATCC ACGTTTAATT 

30 

ATCCGCAAAG TTATCACTAT TATATGGATG 
ATAGAAAGAA CATTCATATT CCAAATGGAG 

35 AAATATAATG ACGTTTTAGA ACAACAAGGT 
GAAAATGGTC ATATTGGATT TAATGAACCT 
GTTGATTTGA CTGAAaGTAC TATTAAGGCT 

40 GTTCCAAAGC AAGCCATTTC GATGGGACTT 
TTACTCGCAT TTGGTGAAAA GAAACGTGCT 
TCTGTTGATG TTCCAGCCAC ATTACTTCAC 

45 

GAOGAAGCTT GCCCGAAAAA TGTTGCGAAA 
TGTTTAATTA AGAAATGCCT CGGGAAAGGT 
ATGATTTTTA GTGGAATTAC AATTAGCAAT 

so 

GTTAGCAAAT AAAGTAAAAG ATTATGTAGA 
CAACGaAGGT TTACCAGCAG TTAAACATAT 

55 



XXX Wl X Wll 


CAGGATGTGG 


AAATATTAt" , T 




V»^» A X A 


AAATTAAATG 




*s fin 


GTAATTAAAA 


CCTGCAATTA 


AAAATTfUTP 








C ATTTH UTAH 
>~*"Wx x lunlnu 


"7 a on 


>H-*WVw\».X 111 


/v>J 1 1 VJ 1 \*V»A X 




J4oU 


AX lAAAAAUi 


w 1 luA 1 L.viA 


AATGG X X CUC 


3540 


A 1 AlJAt-AvjviT 


TTATGTTCAA 


IV IV * IV IV IV 

AAGAAGCAAG 


3600 


TTCGAAUACG 


TTCACTCCTT 


ACACTATCAA 


3660 


All CGATAAT 


TGTATACGAT 


TGCTCAATTA 


3720 


ACTCAGGATT 


ACGTAATCAT 


ACAGCATTAG 


3780 


GGAATTTGAA 


AAGTGTTAAA 


CATTaaaAAT 


3340 


CATAAGTTTT 


TAAAATGTAT 


TAAATlTCyrG 


3900 


TAGGATCGAA 


AAAACAAGCA 


TCATTCTATG 


3960 


TTAATCAGCA 


CTGTAAACTA 


GGTTTAGCAA 


4020 


AACTTGTTAA 


GTTGTTAAAT 


AAAAATCAGT 


4080 


TAGACGAATA 


TGTAGGTTTA 


ACCGCATCAC 


4140 


ACATGCiTiT 


CAAACAATAT 


CCTTATTTTA 


4200 


ATGCCGATGA 


TATGAATGCG 


GAAGCGTgCA 


4260 


CAACGTGATA 


TTCAAATTTT 


AGGTATTGGT 


4320 


GGTACGCCGT 


TTGATAGCGT 


TACTCATATC 


4380 


AAlAOJlUsAl 


ATTTTAAAAA 


CGAaGATGAT 


4440 


G CTAATAXTC 




ACGTATCATT 


4500 




nl 1 XAX X AAA 


X VJA\7vxAAAX X 


4560 




IV ttitt/^ A <""" TA T* 
Alul lVxAVsAX 


ATATTTAGAC 


4 620 


ATTCATGTCG 


ATGAAATGGA 


TTGATTGCAA 


4680 


TCCAATAGAA 


AGATAAAAAG 


CATTGGAAGG 


4740 


TGATTTATTA 


AACAAAGAAG 


ACGCGGCTGA 


4800 


TATCGTAGAA 


ATCGGTACGC 


CAATCATTTA 


4860 


GGCAGACAAC 


ATTAGTAATG 


TAAAAGTATT 


4920 
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CGCGGATGTA ATTACAATAC TAGGTGTTGC 
AGAAGCTCAT AAAAATAATA AACAATTACT 
5 AAAACGTGCA AAAGAACTAG ATGAAATGGG 

TGATTTACAA GCAGAAGGGC AATCACCATT 
TAAAAATTCT AAAGTTGCAG TAGCAGGTGG 

10 

CGCTGAAAGT CCTGATCTTG TTATTGTTGG 
AGAAGCTGCG AAACAATGTC GCGCTGCAAT 

15 ACTATCAATT AATTCTAGAT GAATTAAAGA 

TTTCAACTTT TGCATCCAAA ATACTACATG 
GTTCAGGATT OGTGGCGAAT AGTTTTGCAA 

20 ATGTTGTTGG AGAATCAACG ACACCTGCGA 

CTGGTTCAGG TTCCACGGAA CATTTAAGAT 

CTGACATCGT ATTAATTACT ACAAATAAAG 

25 

ACATCGTTTT GCCTGCAGGT ACAAAATATG 

GTTTGTTTGA ACAAGCATCT CAATTATTTT 

AAATGAATGT TACGGAACAA ACGATGCAAC 

30 

ATAGTCGATA ATATGATGCC T AGG CAG AAA 
AAATTATAGT ATAATATCAA TAATAAACGA 

35 TATATTTTTG ATTTTGATGG TACGTTGGCA 

CAAAGTG CAT TTAAAGCATG TGGCTTAACG 
ATGGGAATAC CTATTGAAGA ATCATTTTTA 

40 GCATTAGCAA AGTTAATCGA TACATTTAGA 

ATTTATGAAT TTGCGGGTAT AACTGAAGCC 
CTTTTCGTGG TGTCTAGTAA GAAGAGTGAT 

45 

TTAAATCACT TGATTACCGA AGCTGTTGGA 
CCTGAAGGCA TACACACAAT TGTGCAACGC 
ATTGGTGATT CAACGTTTGA TGTTGAGATG 

50 

GTCACTTGGG GTG CACATGA TGCAAGGTCA 
AATGATCCAT CAGAAATTAA TACCGTATTA 

55 



AGAAGATGCA TCAATTAAAG CAGCTATTGA 504 0 

AGTTGATATG ATTGCTGTTC AAGATTTAGA 5100 

TGCTGATTAT ATTGCAGTAC ACACTGGTTA 5160 

AGAAAGTTTA AGAACCGTTA AATCTGTTAT 5220 

AATTAAACCA GATACAATTA AAGATATTGT 5280 

TGGCGGAATC GCAAATGCAG ATGATCCAGT 534 0 

CGAAGGTAAG TAATATGOCT AAATTTAGTG 54 00 

TGACTTTGTC ACATGTTGAA GCGGATGAGT 5460 

CTGAACATAT ATTTGTAGCT GGCAAAGGAC 5520 

TGCGCTTAAA TCAGCTCGGC AAACAGGCAC 5580 

TTAAGTCGAA TGATGTATTT GTAATTATCT 5640 

TATTAGCAGA CAAAGCAAAA TCAGTAGGTG 5700 

ATTCTGCAAT AGGCAATCTA GCTGGGACGA 576t) 

ATGAACAAGG CTCGGCACAA CCATTAGGAA 5820 

TAGATAGTGT TGTAATGGGA TTGATGACTG 5880 

AAAATCATGC TAATTTAGAA TAAAATAAAG 5940 

TATTATCGAT TATTTTTTTA TTTAAATAAT 6000 

ATAGGGGTGT TAATATTGAA GTTTGACAAT 6060 

GACACGAAAA AATGTGGTGA AGTAGCAACA 612 0 

GAACCATCAT CTAAAGAAAT AACGCATTAT 6180 

AAATTAGCAG ACCGACCATT AGATGAAGCA 6240 

CATACATATC AATCTATTGA AAAGGACTAT 6300 

ATTACAAGTT TGTATAACCA AGGGAAAAAA 6360 

GTATTAGAAA GAAATTTATC GGCTATTGGA 6420 

TCCGATCAAG TAAGTGCATA TAAACCAAAT 64 80 

TACAATTTAA ATAGCCAACA AACGGTGTAT 654 0 

GCACAACGTG CTGGTATGCA ATCTGCAGCT 6600 

TTACTTCATT CAAATCCGGA TTTTATTATT 6660 

TAAAACTTGT TAAAACAGAG AATACCATGG 6720 
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w 



15 



20 



25 



30 



35 



45 



50 



ATTTAAAATA AATATTTATT AAACATTATG AATTTTTAAA GAGTAATGTC TGACTCGTTG 
ATAATTTATT TTTGTAAAAA TAAATTAAAG TAATGACAAA GTTATTGAAG TAAATTGAGT 
ATAAACATTT AAATACGATG TCGAAAATGG CGATAGCATA TCACTTACAT GAAGTTGTGT 
GctATCGCTA TTTTTAGTTA TAATTCCAAA AAGTTAATCG TTCGATGATT TAAGAATTAT 
TATTGTTTAA TTCAAATGTA TGAGGGTATA AAATCATTGA ATTTAATTCG ATAAAGCGAA 
ATTTTTGAAC AAACATACTT TTGTATTTAT ATAAAAGTTT AAATTCTTAT AAATTTGACA 
AAACTAATTA ACTCCGTATA ATTATGAAAC ATACAAGAGG GAGTGTATGA ATTCATGQAT 
TTTAATAAAG AGAATATTAA CATGGTGGAT GCAAAGAAAG CTAAAAAAAC CGTTGTTGCA 
ACCGGTATCG GTAATGCAAT GGAATGGTTC GATTTTGGTG TCTATGCATA TAcAACTGCG 
TACATTGGAG CGAACTTCTT CTCTCCAGTA GAGAATGCAG ACATTCGACA AATGTTGACT 
TTCGCAGCAT TAGCCATTGC GTTTTTATTA AGACCAATTG GTGGTGTCGT ATTTGGTATT 
ATTGGTGACA AATATGOACG TAAAGTTGTA TTAACATCTA CAATTATTTT AATGOCATTT 
TCAACATTAA CCATTGGATT ATTGCCAAGC TATGATCAAA TTGGACTTTG GG CACCAATA 
CTATTATTGC TTGCAAGAGT ACTACAAGGG TTTTCAACAG GTGGAGAGTA TGCGGGGGCA 
ATGACATATG TTGCCGAATC ATCTC CAGAT AAGCGTCGTA ACTCATTAGG TAGTGGACTA 
GAAATTGGGA CATTATCAGG TTACATAGCT GCTTCAATTA TGATTGCTGT ATTAACATTC 
TTTTTAACAG ATGAACAAAT GGCATCATTT GGTTGGAGAA TCCCATTCTT ACTCGGTTTA 
TTCCTAGGAT TATTCGGCTT ATATTTACGT CGTAAGCTGG AAGAATCACC AGTTTTCGAA 
AATGATGTTG CAACACAACC AGAAAGAGAT AACATTAACT TTTTACAAAT CATCAGATTT 
TATTACAAAG ATATATTTGT ATGTTTTGTA GCTGTTGTAT TCTTCaATGT TACAAACTAT 
ATGGTAACTG CATATTTACC AACCTATTTA GAACAAGTTA TTAAATTAGA TGCAACGACA 
ACAAGTGTAT TAATTACTTG TGTCATGGCA ATAATGATTC CATTAGCATT AATGTTTGGT 
AAGTTAG CGG ATAAAATAGG TGAAAAGAAA GTATTTCTAA TTGGTACTGG TGGGCTAACA 
TTATTCAGTA TCATCGCATT TATGTTATTA CATTCACAAT CATTTGTTGT AATAGTAATC 
GGTATATTTA TATTAGGATT TTTCTTATCA ACTTACGAAG CGACAATGCC AGGGTCGTTA 
CCAACGATGT TTTACAGTCA TATAAGATAT CGAACTTTAT CAGTAACATT TAATATCTCT 
GTTTCGATAT TTGGTGGTaC GaCGCCATTA GTkGCAmCaT GGTTaGTTAC GAAAACTGGA 
GATCCATTAG CmCCTGCGTA TTATTTAACA GCAATCAGTG TTATTGGCTT TTTAGTTATT 
ACATTCTTAC ATTTAAGTAC AGCAGGAAAA TCTCTAAAAG GTTCGTATCC AAATGTAGAT 



6840 

6900 

6960 

7020 

7080 

7140 

7200 

7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 
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10 



IS 



20 



35 



40 



SO 



GAACGTAAGA 
AGCTAGTAGG 
ATAAAGTTTT 
GGQACTTAAA 
GGATGTAAAT 
CAATATTATT 
TGCGATTGCG 
CATGGTACTA 
TTACCTGATA 
ATTGAGTGAG 
AAACCTAATG 
GCCCGCATCA 
ATTAATATGA 
AAAGTGCCTA 
AAATATGGTA 
ATGTTTATTG 
TCAGGGACAA 
TTTGAAGTTA 
CTATCG CACT 
ATAGGACAGA 
T ACAAAG TTG 
AATGAACATA 
AAAAAGATAA 
ACCAGTTTTA 
TTTCCAAATG 
ATAAAAAGTA 
TGGTTTGTTA 
CAACAGGATA 
TTAACGCAAT 



ATTAGAGATT 
TTCTGCTAAC 
TGTATATACA 
GCATATGTTT 
ATGTCTTAGA 
ATAGAGAACA 
ATAACTTCTT 
CAGTATCAAA 
AAAATACTTA 
GGATATTGAT 
ACATAGCATT 
CTAGCGCAgT 
AATCACCGGT 
TGATGATGGA 
TTAAAGATGT 
ATTCAACGCA 
CTGGACTGCC 
ATGAAATGTT 
CGTTAACATT 
CCACTTTTCA 
CTATGTTTCT 
CAATCCAATC 
AAAATCAAGC 
TCAGCTATAA 
TGGAATTGAA 
ATATGATGTT 
CTAATGATAA 
TGTTAATTAT 
CTTCGAGCAT 



TTAATaAAAA 
TTTAAAGTGC 
TAAACCCCCA 
AGCTTTGAAT 
GTATTTTGTC 
CAAACTTAAA 
TTCTCTATAT 
TTTATCTAGG 
TTCATTATAT 
GAACGTAATT 
ACATATCGAT 
TGAATCTTTG 
GCAAAGTATT 
AGGTAAATGG 
AATTGGAGAT 
ATTACAGCAC 
AAAAGCATAT 
GATGTTAAAA 
ATATGCGTTA 
TCCTGAAAAG 
TGTTCCAACG 
ATTTTTTAGC 
AAATGACATA 
CTTGAATCAG 
AACAACGAAT 
TAGTGGCTAT 
TGGCTATGTA 
TGGTGGTCAA 
TGATGAAGCA 



GTATAAATCA 
TTTTTAAATT 
CTGCAATGAT 
ACTTAAAATT 
CAACGCAATT 
TAGATTGGGT 
ACATATAGTA 
GCTTAAGTTT 
AATGTTAACA 
TTAGAACAGT 
GATGAAACAA 
CAGAAATATT 
ATTTGTTATT 
CAAAGTACTA 
ACAGGTCTCA 
TACCCCAATT 
TATCGTGATG 
AATGAAAATG 
TTGTTTGCTT 
TTACTTAATC 
ATGATTAAAT 
AGTGGAGATA 
AATTTGATTG 
CAAGCACCAG 
CACGATCACA 
GTAAGTGAAC 
AAAGAGCAGT 
AATATATATC 
ATTATCAT CG 



ATCX3TATATA 
GAGAACTGTA 
TATCGCAATG 
CTCTTGCTAT 
AATATTGAGA 
GACTTATTTG 
ACGTCTTATC 
GATTTTTATA 
ATATGTATTT 
TGAAAACACA 
TTACATATAG 
CACTTAACCC 
TAGCTTTGCA 
TACATCGTCA 
TGCAGAATAT 
TATTACATAT 
AAGATTCATG 
CAATAGCAGC 
TAAGTTCCGG 
AATGTCATAA 
CATTATTGTT 
AGCTGCATTC 
AATTTTTTGG 
TTGAATCAGT 
ATGGTATAGG 
AATGTATAAA 
ATTTATATTT 
CAGCACATGT 
GTATTCCAAA 



AGCACTTTAA 
ATTAGCCGTA 
GGGGAAAGAG 
TGAAATGTTA 
CTCTAACCTT 
TGTCAGTTAT 
TAATAAAAAA 
ATAGGCAGGT 
TAAAGTTTAC 
TACTCAAAAT 
TCAACTAAAT 
TGTCGTTGCT 
TCGTTTACAT 
ATTGATTGAA 
AGACTCACCG 
TGGTTTTACT 
GTTGGCTTCT 
CCCTGGACCA 
TCGTACTTTT 
AATATCATCA 
AGTTTACAAC 
TTCTATTTTT 
TACATCGGAA 
AGGTGTGCTA 
AACTATTTGT 
TAATGATGAA 
AACGGGACGT 
TGAACGCCTT 
TGAGCGTTTT 



8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
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CAATTTTTAA AAAAGAAAGT GAAaCgnTaT GAAATTCCAT CGATGATTCA TCATGTAGAA 


10440 




AAGATGTATT 


ACACTGCAAG tGGTaAAATT 


GCTAGAGAAA 


AAATGATGTC 


GATGTATTTG 


10500 


5 


AGAGGTGAAT TATAATATGA ATCAAGCAGT 


CATAGTTGCA 


GCTAAACGAA 


CTGCATTTGG 


1 ft C £ f\ 

10560 




GAAATATGGT GGCACTTTAA AACATTTAGA GCCaGAACAA TTGCTTAAAC CTTTATTCCA 


10620 


10 


ACATTTTAAA 


GAGAAGTATC CAGAGGTAAT 


ATCTAAAATA 


GATGATGTAG 


TTTTAGGTAA 


10680 


TGTTGTTX3GG 


AATGGTGGCA ATATTGCAAG AAAAGCATTG 


CTTGAAGCGG 


GGCTTAAAnA 


10740 




TTCAATACCT 


(VSOfiTPAOAA *TfY2 TxTTYlT'/"' ft 


ATGTGGGTCT 


GCi APTTY3 A A A 


fiTYiTTPA AT7A 


10800 


15 


TGCATGTCGC 


fATYUv.nvv'TA tai** rmr*kfv<'iv«r 
Ax\*AJLaJwIAL* CtJwwtwWTGG 


iv MMm» w%T4 m 

CAAGGTATAT 


n X X UV^AU'VJ XVJ 


fl'IYS'l'IYa B B TV 
v» 1 V9l IwlAAu 


10860 




TACAAGTCGA 


uCACLXIvmA AAATCAAACG 


% Mj"^^M» (HHMill 

ACCGCATTCT 


V» xY» x ALuA/vi 


UivjCAl 1ACC 


10920 




xuvwx. x x x^^x 


GLAGCGTGCAT CATTTGCACC 


TGAAATGAGC 


m f\ MM/-i » rp/i TA ?v 


iryi TV nvn/i TV ta^m 

TQATTC-AAGG 


10980 


20 




GTGGCGAAGA TGTATGATGT 


TTCAAGAGAA 


T«T*TV JV/"«TV'TV"» 

1 1ACAAGAXG 


AATTTGCTTA 


11040 






CAATTGACAG CGGAAAATGT 


AAAGAATGGA 


AATATTTCT C 


ft. m % ft *v« ft m*w 

AGGAAATATT 


11100 






GTTAAAGGAG AAATATTCAA 


CACTGATGAA 


AGTCTAAAAT 


^i ft. ft ^n^t ^nm^*^^ 

CACATATTCC 


11160 


25 


O A AAA ATA A P 


xTTGGCCGAT TTAAGCCCGT 


GATCAAAGGT 


GGGACCGTTA 


^^^^ ^*l^ft ft ft 

CCGCTGCGAA 


11220 








ATTGCTTATT 


7A TV/^ TV TV TV, TV TV 

ATGGAAAAAG 


ATATGGCATA 


11280 


30 


OGAATTPAfJrtT 








GTGTTGATTC 


11340 


TAATTTTCCT 


GGP_ATT£30TP PAnTAPPUfZP 


Ln ill 


TTAPTAATA AA 


f~* TV TA TATf'TV ZV*p*T* 


11400 




AACGATAGAA 


AATATTGAAG TCATTGAAAT 


TAAPf^TAAfZPn 


TTPAGTfl P A P 


nw X X X \a^- 


11460 


35 


CTGCCAACAA 


GCTTTAAATA TTTCAAATAC 


GCAATTAAAT 


ATATGGGGTG 


GTGCATT A G C 


11520 


ATCAGGTCAT 


CCATACGGTG CAAGCGGTGC 


CCAATTAGTG 


ACTCGATTAT 


TXTATATGTT ' 


11580 




TVjACAAAGAG 


ACTATGATTG CATCTATGGG 


GATAGGGGGA 


GGTCTAGGAA 


ATGCAGCATT 


11640 


AO 


ATTTACTCGA 


TTCTAACCAG CGATTAAATG 


TGTCATTTTC 


TAAGGATAGT 


GTGGCTGCAT 


11700 




ATTATCAGTG 


TTTTAACCAA CCTTATAGAA 


AAGAAGTACC 


ACCATTAATG 


TGTGCGTCAT 


11760 




TATGGCCAAA 


ATTTGATTTA TTTAAAAAAT 


ATGCAAATAG 


CGAACTGATT 


TTAACAAAAT 


11820 


45 


CAGCAATTAA 


TCAAACTCAA AAGATAGAAG 


TAGACACAAT 


ATATGTAGGG 


CATTTAGAAG 


11880 




ATATTGAATG 


CCGACAGACT CGCAATATCA 


CACGTTATAC 


AATGGCTTTA 


ACATTAACTA 


11940 




AAAATGATCA 


ACATGTCATA ACGGTtACAC 


AAACTTTTAT 


TAAGGCGATG 


AAGTAGAGAT 


12000 


SO 


GGAGTTTAAT 


GAGATATGGA TAAATGAATA 


TTTGGCGCTC 


GTAAATGATG 


ATAATCCAAT 


12060 




ACATAATGAG 


ATTGTGCCAG GACAATTAGT 


GAGTCAAATG 


ATGCTGATGG 


CTATGTCATT 


12120 



55 



633 



EP0 786 519 A2 





ATTCATTGAA 


CAACACGAAC ACGAAATTAT AGCAATTAAT GACGATGGAG 


AGATTAAAAT 


12240 




AAAAATTTCT 


TTGAGCACAA AAAAATAACC GATATTAGCT GCATGAACGC ATATTAATTA 


12300 


5 


GGAGATGAAA 


GGACAGCTAA TATCAGTTAT GTATTGTTAT TATTATTGGG 


AACAGAGATG 


12360 




AATATAGGTT 


ACGTTTCTTT CTTTGCAOGG GGATGCATTA ATCTAAAATA ATAATAACAA 


12420 


10 


CTATATCAAT 


GTTTAATAAA TTCTGGATTA TTGGAACGAT TAGTCAATTT AACTAACTTT 


12460 


CATATGATCT 


ATATCGTCTT GTAATAAAGA GAGCAATTTG AATATTTCAG 


TATCACTAAA 


12540 




TGAATCGTCA 


CATTTAATTG AAACATGCTG AAACGTTTTG GTTATAATTT 


CATAAACTGG 


12600 


IS 


TGCGCCTTCA 


TGGTGATACT GTCGATAAAT AATCATAACC TATATTACCT 


CCTTTGCTAC 


12660 




TCTATGGTTA 


TATTATAAAT AACATTTTTA TGTGTGACAT CAACCTTAAG 


TATCAACTTT 


12720 




TTATCAGACA 


TAGAACGTAT GATTTACTAA GACTATTTAT GTATAAAAGT 


TCTAAATAAA 


12780 


20 


TATATATTTA 


TAGAGTCGCC TGGCAGTCAT TTGGGaAATA TAACATATAT 


GATTAGAGAG 


12840 




GCATCTATCG 


CAAAAGAATG ATAATGATAG AGGTATTGAG CATATAGATG 


AGTTTAAGTT 


12900 




CATCTTGAAA ATAAAGGGTT ATTTAGTCAT AGATGTAGAT GTATAGGAAA 


TATTTGTATG 


12960 


25 


TATTGTTCGA 


TATGTATGAA ATTTTCAATA AAAGCTAATA ACGCTTATAT 


GTAACTTTCA 


13020 




AATTTAAATT 


ATATACAGAG CATGATGATT ATAAAAAAAT AACCACATCA 


CATAAATTGA 


13080 




GTTCATACCC 


AATTTAAGTG GTGTGGCTAA TAATGTTGAT TTATAGATGA 


ACCGCCTAAT 


13140 


30 


CGTTAAACCT 


CTGTTACTTC AACATCGATA TGTTCAATAC GGTTGTATGC 


ACCGTGATCC 


13200 




ACAGGACCAA 


CAAAATCATT CATTTTCCAA CCGTTTTTAA TAGCAGAAGC 


GACGAAAGCT 


13260 


35 


TTCGCGCTAA 


TCACAGCTTC TTTCGGTGAC TTACCGTTAG CTAAATATGC 


AGTTGTTGCC 


13320 


GCAGCAAATG 


TACAACCAGC ACCATGGTTA TAACTTTGTT GGAACATGTC 


TGTTGTTAGT 


13380 




TGATAAAATG TTTGACCATC ATAGTATAAG TCATACGATT TATCTTGATC 


TAAAGCTTTG 


13440 


40 


CCACCTTTAA 


TGATGACATG CTGTGCGCCT TTATCAAAGA TAATTGTTGC 


AGCCTTTTTC 


13500 




ATATCTTCAA 


TTGAATTTAA TTTACCTAAT CCTGATAATT GACCCGCTTC 


AAATAAGTTT 


13560 




GGTGTCACTA 


CCGTTGCTTT AGGTAGTAAA TATTTAATCA TCGCCTCAGT 


ATTTCCAGGA 


13620 


45 


TTAAGCACTT 


CATCTTCGCC TTTACAAACC ATGACAGGAT CTACTACAAA 


ATATTGTGCA 


13680 




TTAGATGCCT 


CATATACTTC TCCAGCACGT TTGATTATCT CCTCAGTACC 


TAACATACCT 


13740 




GTTTTAATAG 


CATCAGGTCC GATTGATAAA GCCGTTTCAA GTTGTTTTTC 


AAATACATCC 


13800 


60 


ATTGGTAATG 


GTGTAACATC GTGTGACCAT GTATCTTTAT CCATAGTAAC 


GATGGCAGTT 


13860 




AAAGCGACCA 


TGCCATACGT ATCTAATTCT TGGAACGTTT TCAAATCTGC 


TTG CATACcT 


13920 
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CACTCCTACA TAATAATATT GTATTCATCA 
AGCATTCAAT ATTTGATGAT TGTTGAAATG 
5 TGTCATTCAC TTTAGATAAG TGTGATATGT 

AATGGTCGCA AATTTTTCAT GACATAACAA 
TTTTAGAAAA AGAATATTCG ACTGCAATCG 

10 

CGTTTGATTT AACACCGTTT GAAAATATCA 
ATGGTCCAAA CCAAGCACAT GGATTAGCAT 

/5 CATCTTTACG TAATATGTAT AAAGAATTAG 

CGCATTTACA AGATTGGGCA AGAGAAGGCG 
GACAGGGTGA AGCAAATTCT CATCGTGATA 

20 TTAAAGCAGT GTCTGATTAT AAAGAACATG 

AGCAAAAAAT AAAGCTTATC GATACATCTA 
GTCCACTGTC TGCATATAGA GGATTCTTTG 

25 ATTTAGAGTC AGTAGGAAAA TCACCAATTA 

ATAGAGAAAC TTTAATAGCA CGAATTGAGC 
ATGACCATGA CTTTGAAAAA CATATGTATG 

30 

CAACATCAAA TACACCACAT ATTGGTGAAC 
ATCAAATGCC ACAATCACAA ATAACGCAGC 
AAGCGATGGG TGGTAAAGTA AATACGGATT 

35 

AACCTTCAAA CCAACAACAA AGATTAGCGA 
TATCtG ATTT TTAAAAAGCA ACAATGAAAC 

40 GGTTAATAAT CAAGACGCAT ATACTTTTAT 

ACTGAATTAT ATAAGGAGAG GTAGCAATGA 
CGATGATGGC TGTCGGTACA GGTGCATTTG 

45 ATCACTATTT ATCAGTATGG GAAAAAGCAA 

TATTAATTAT AGGTGTAATT AGTGGTACAA 
TAATATTTGC TGGTATTATT TTCTTTAGTG 

SO 

TTAAAGTTTT AGGTGCGATT ACGCCAATTG 
TGTTAATCAT TGCGACATTC AAATTTGCTG 

55 



TATCATTTTT AACCTAATTG AAAAATATTA 14040 

AATCATTCAT ACTATTGTAA CTTTTGAAAA 14X00 

TAAAATATGT CCTGAGGTGA GATTGAATGG 14160 

CGAAACATGA CTTTAAAGCT ATGCATGATT 14220 

TATACCCTGA TAGGGAAAAT ATATATCAAG 14280 

AAGTTGTTAT ATTAGGACAA GACCCGTATC 14340 

TTTCAGTGCA ACCTAACGCA AAATTCCCTC 14400 

CAGATGATAT TGGATGCGTT AGACAAACAC 14460 

TCTTGTTATT GAATACAGTT TTAACCGTAA 14520 

TTGGTTGGGA AACATTTACT GATGAAATTA 14580 

TTGTCTTTAT TTTGTGGGGG AAACCTGCAC 14640 

AACATTGTAT TATAAAATCA GTGCATCCTA 14700 

GATCAAAACC GTATTCCAAA GCGAATGCCT 14760 

ATTGGTGTGA AAGTGAGGCG TAGATGTTGA 14820 

AAGAATTAGT ACAAGCAGAG CAGGCACAGC 14880 

CCATACATAT ATTAACATCT TTATATG CTT 14940 

AACAAATGAA TCGTCGTATT GCTAACCATA 15000 

CAACTCATCA AGTGACAGTT GCTGAAATTG 15060 

CAGCACATCA TCATAATAAG TCATATTCAC 15120 

CAGATGATGA CATTGGCAAT GGTGAATCCA 15180 

ATAATTACTT AATAGCTTGT TAAGTATGTA 15240 

TCGAGTGTTC GGATTTAAAC ATTTATTAAT 15300 

AATTATTTAT TATTTTAGGT GCATTAAACG 15360 

GTGCGCATGG TTTACAAGGA AAAATAAGTG 154 20 

CGACGTATCA AATGTACCAT GGCTTAGCAT 154 80 

CTTCAATCAA TGTTAACTGG GCTGGCTGGT 15540 

GATCATTATA TATTTTAGTA TTAACTCAAA 15600 

GTGGCGTATT GTTCATCATT GGATGGATAA 15660 

GTTAAATTTT AAAACTTTAG ATTAC CTATG 15720 



635 



EP0 786 519 A2 



10 



is 



20 



25 



30 



35 



40 



45 



SO 



TGGOTATAGA ATACCTTCGA 
ATAGAGGCGA TTTAAAACAA 
CATGTATCGG ATGGGGCGCA 
TTGCAGCATC AATTGGTATA 
ATGGCGCATT AGTAGAGAGA 
GTTTCGGCAG ATATGTGAGT 
TCGTTGCTTT AAAtGCGACC 
TAAATAATGG GAAACTATAC 
TTGCGACCGT ATTACTACTT 
GATCATTACA ATATTATTTC 
GTTCATTCTT TGGTAATAAT 
AAGGATGGTT AGTGTCTATT 
TTGATAATAT TCCACAAACA 
TTATCGTGTA CAGTTTATTA 
GTTGGTTATC AACAAGTCAT 
CACAAACAGC ATTTGGTTAT 
TATTTACTGG TTTAAATGGA 
GTTCAGGTAT TATGCCAACA 
TCGCAATCAT ATTCCTAGTA 
TGACTTGGAT TGTAGATATG 
TGTCTGCAGC GAAATTATTC 
AAACGTTTGC TATTATCGGC 
CAGGTTCTCC TGCAGCACTG 
TCGGTTTAAT ATTCTTTGTG 
TAAGTCGCTT GATTTTAAAT 
AAAAAGAAAA AACTAAATAA 
ATCGTGCGAT TTTTTGTATT 
TAATTGCTAA GAGTTAGGGC 
TTCACGAACC CAGAAACAAT 



GGTGAGTTTT 
AACCTATCTG 
TTCATCTTAC 
GTTATTGGTG 
TTTCCAGTAT 
TTCTTCTCAT 
GCATTCAGTT 
ACCATTGCGG 
GTATTCATGC 
TGTGTGGCGA 
TTTGCACTTG 
GTGGTTATTG 
GCAGAAGAGT 
GCAGCATCAT 
CAAAGTTTAA 
ATTGGATTAG 
TTCTTGATGA 
ATGTTTAGTA 
GGAGTGTCGT 
TCATCTACTG 
AGTTATAACA 
TCATTTGTAT 
ACTGCACCGT 
ATTCGATATC 
AGAAGTGAAA 
TAAAAGAATC 
ATAAATTGAC 
TGAGCCATTT 
TAATTTGGAA 



TATTTATGGA 
AAAAGTTTGT 
CAGGAGACTG 
CATTATTAAT 

CAGGGGGCGC 
CATGGTTTTT 
TACTAGTTAA 
GCTGGGACGT 
TAGTAACGAT 
TOGTAATCGT 
AAAATTTACA 
TATCCGTGGC 
TTAACTTTGC 
TAACTTATGT 
ATGGGCAGTT 
GTGTATTAGC 
GTTCAAGTCG 
AATTACATAG 
TAATTGCACC 
GTGTATCCAT 
AACAAAGTAA 
CATTCATTTT 
CTTATATTGC 
CTAAATTGAA 
ATGAAGTTGA 
GCACAATAAA 
ATTTAAGACG 
CTAACAAATA 
ATTTGGTCGG 



AAAAAAGAAT 
ATGGGCGATT 
GATTAAGCAG 
GATATTAATT 
GTTTGCCTTT 
AACTTTTGGT 
ATTCTTATTG 
TTATATTACG 
TCGTGGCGCA 
CGTATTATTG 
ACCGTTAGCT 
ACCATGGGCA 
ACCAAACAAG 
TGTCATGATT 
GTGGTTAACA 
AATTGCAATT 
CTTGTTATTT 
TAAATACAAA 
TTGGCTAGGA 
TGCCTACTTT 
TACGTATGCA 
CTTAG CGTTG 
ATTACTTGGA 
AAATATGGAT 
TGATATGATT 
CCTTCTTCAT 
AGGCAGCTGA 
TTTATAATCG 
CGAATAATAA 



AAG CAAAT AG 
GCATATGGTT 
TCAGGTCCGA 
GCGGTTAGTT 
AGTTTCTTAA 
TATGTCTGTG 
CCAGATGTCT 
GAAATCATTA 
AGTGTATCTG 
ATGTTCTTTG 
GAACCTAGCA 
TATGTTGGAT 
ACATTTAAGC 
TTATACACTG 
GGTGCTGtTA 
ATGATGGGTA 
TCTATGGGAC 
ACACCATATG 
AGAACTGCAT 
ATTACATGTT 
CCGGTTTACA 
TTATTAGTGC 
TGGTTAATCA 
AATGATGAAT 
GAAGAACCTG 
TCGGAGGCGT 
ACCTTATATA 
TTTAAAAGAT 
ACCTAATGCG 



15840 

15900 

15960 

16020 

16080 

16140 

16200 

16260 

16320 

16380 

16440 

16500 

16560 

16620 

16680 • 

16740 

16800 

16860 

16920 

16980 

17040 

17100 

17160 

17220 

17280 

17340 

17400 

17460 

17520 



55 



636 



EP0 786 519 A2 



10 



15 



AAGACTAAAT TTTTTGTAGC ATCOTATGCT AAGCCACCAG GTACTAATGG AATGATACCC 1764 0 

GTTACCATAA AAATGATGGC AGGTTCTTTT TGTTTACGAG CCATATAATG ACTTAACAAG 17700 

CCTAATGCTA AACTACCAAA GAAACTAGAG TATATAGTGT GCACATTAAA GCCGTTGAAG 17760 

AATAAGGTGT AAACCATCCA TCCACACGTA CCAACGAAAC CACATGATAG ATATAATTTT 17820 

CTAGGTGCAT CAAAAATGAC GCAGAA 17846 
(2) INFORMATION FOR SEQ ID NO; 110: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: SS44 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 



25 



30 



35 



40 



45 



50 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 110: 

ATTGACACTT GGTGAAAGTA ATATCGCCGC GCTATTTTGG CAAAATGGAC ACTTAGAACC 60 

TGAGTTACAA GATGAACAGC CAATTAATAT ATTAGGATCT GkTCAAATCA ACGAATGGAA 120 

TGGTAATCAA TCACCGCAAA TAATTATTCA AG ATATTG CG ATGAATGAAC AGCAAATATT 180 

AGATTATAGA AGTAAGCGAA AAAGTTTACC TTTTACAGAA AATGATGAAA ATATTGTCGT 24 0 

GCTTATTCAT CCTAAAAGTG ATAAAGTAAA TGCGAATGAA TATTATTATG GTGAAGAAAT 3 00 

TAAACAACAA ACTGATAAAG TAGTATTAAG AGATTTACCA ACGTCAATGG AAGACTTGTC 360 

TAATTCCTTG CAACAACTGC AATTTTCTCA ACTTTATATA GTTTTGCAAC ATAATCATTC 420 

GATTTACTTC GATGGTATAC CTAATATGGA TATTTTTAAA AAGTGTTATA AAGCATTAAT 480 

AACTAAACAA GAAACAAATA TCCAGAAAGA GGGTATGTTA TTGTGTCAAC ATTTAAGTGT 540 

GAAA£CAGAT ACACTTAAAT TCATGTTGAA AGTTTTCTTA GACTTAAAAT TTGTAACACA 600 

AGAAGATGGT TTAATTCGAA TCAATCAACA ACCTGATAAA AGATCGATTG ATTCCAGCAA 660 

AGTATATCAA TTAAGACAAC AACGTATGGA TGTTGAAAAG CAATTATTAT ATCAAGATTT 720 

TTCAGAAATA AAAAATTGGA TAAAGTCACA ATTGTCGTGA GCAATTTAGG AGGAAATATT 780 

AATGGATTTA AAGCAATACG TATCAGAAGT TCAAGATTGG CCGAAACCAG GTGTTAGTTT 84 0 

CAAGGATATT ACTACAATTA TGGATAATGG TGAAGCATAT GGCTATGCAA CAGATAAAAT 900 

TGTAGAATAC GCAAAAGACA GAGATGTTGA TATCGTTGTA GGACCTGAAG CGCGTGGCTT 96 0 

TATCATTGGC TGTCCTGTAG CTTATTCAAT GGGGATTGGC TTTGCACCTG TTAGAAAAGA 1020 

AGGGAAATTA CCTCGTGmAG TCATTCGTTA TGAGTATGAC CTAGAATATG GTACAAATGT 1080 
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ATTAGCTACT GGTGGTAOOA TTGAAGCAGC AATAAAATTA GTTGAAAAAT 


TAGGCGGTAT 


1200 




CGTAGTAGGT ATTGCATTTA TAATTGAATT GAAATATTTA AATGGTATTG AAAAAATTAA 


1260 


5 


AGATTACGAT 


GTTATGAGTT TAATCTCATA CGACGAATAA TAAATAATAT AATTTTATCA 


1320 




AATGAAATCC 


TTCATCAAAT 


GTATAAGAAC 


CAATGACTTA ATTAAAAAAG 


TTGTTTAAGT 


1360 


10 


TTTCTTAACA TGAGATGTTA GGATTTTTTA TTTACTGAAA ATGTTAGATG ATTGAGCATT 


1440 


ATACCTTAAT 


AACATCGTTT 


ATTTATTTCA 


TAAATTGTAG 


TATCATAGAA 


CTAATATTTA 


1500 




AAAAATGAAA 


CAGTAGATTT 


AGGTCGAATT 


TTTGTAAAAG 


TTTTAAAAGT 


AGOAATAGTA 


1560 


15 


TACAAATTAA 


ACTOGCTCAA 


GTAAAATTAA 


TATTACGATT 


AATGACGACA 


GGATAAATAT 


1620 




TTATCGTCGA 


CGGACGTATG 


ATTGGTGTGG 


GACAAATACT 


ATTCAACAAG 


AGTACCTAAA 


16B0 




TCATTGTTTA AGGCGAAGTA ATAAATATGA ATGGGGTGTA TCATATAATG 


AACAACGAAT 


1740 


20 


ATCCATATAG 


TGCAGACGAA tTCTTCACAA AGCAAAATCA TATTTGTCAG 


CAGATGAATA 


1800 




TGAGTATGTT 


TTAAAAAGCT 


ATCATATTGC 


TTATGAAGCA 


CATAAAGGTC 


AGTT CCGAAA 


1860 




AAACGGATTA 


CCATACATTA 


TGCATCCTAT 


ACAAGTTGCA 


GGTATTTTAA 


CAOAAATGCG 


1920 


25 


ATTAGACGGA 


CCGACGATTG 


TCGCAGGTTT 


TTTGCATGAT 


GTAATTGAAG 


ATACACCGTA 


1980 




TACATTTGAA 


GATGTAAAAG 


AAATGTTCAA 


TGAAGAAGTT 


GCTCGAATTG 


TTGATGGTGT 


2040 




GACGAAGCTT 


AAAAAAGTAA 


AATACCGCTC 


AAAAGAAGAA 


CAACAAGCTG 


AAAATCATCG 


2100 


30 


CAAGTTATTT 


ATTGCGATTG 


CCAAAGATGT 


ACGCGTAATT 


TTGGTGAAAT 


TAGCAGACAG 


2160 




ATTACATAAT 


ATGCGTACCT 


TGAAAGCCAT 


GCCGCGCGAA 


AAACAAATTA 


GAATTTCTCG 


2220 


35 


AGAAACATTA 


GAAATTTATG 


CACCATTAGC 


ACATCGTCTT 


GGTATTAATA 


CAATCAAATG 


2280 


GGAACTAGAA 


GATACGGCTC 


TTCGTTATAT 


TGATAATGTG 


CAATATTTTA 


GAATAGTCAA 


2340 




TTTAATGAAG 


AAGAAACGTA 


GTGaACGTGA 


AGCGTATATC 


GAAACGGCTA 


TTGATAGAAT 


2400 


40 


ACGTACTGAA ATGGACCGAA TGAATATCGA AGGCGATATA AATGGTAGAC 


CTAAACATAT 


2460 




TTACAGTATT 


TATCGGAAAA 


TGATGAAGCA 


GAAAAAACAA 


TTTGATCAAA 


TTTTTGATTT 


2520 




GTTGGCGATA 


CGTGTTATTG 


TCAATTCTAT 


TAATGATTGT 


TATGCGATAC 


TTGGGTTGGT 


2580 


45 


GCATACGTTA 


TGGAAACCGA 


TGCCAGGACG 


TTTTAAAGAT 


TATATTGCAA 


TGCCTAAACA 


2640 




AAATTTGTAT 


CAGTCATTGC 


ATACTACAGT AGTAGGCCCA AATGGAGACC 


CGCTCGAAAT 


2700 




CCAAATACGA 


ACGTTTGATA 


TGCACGAAAT 


TGCTGAGCAT 


GGTGTTGCAG 


CACACTGGGC 


2760 


SO 


TTACAAAGAA 


GGTAAAAAAG 


TAAGTGAAAA 


AGATCAAACT 


TATCAAAATA 


AGTTAAATTG 


2820 




GTTAAAAGAA 


TTAGCTGAAG 


CGGATCATAC 


ATCGTCTGAC 


G CTCAAG AAT 


TTATGGAAAC 


2880 
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TGAGTTGCCA 


TATGGTGCTG 


TGCCGATTGA 


TTTTGCTTAT 


GCGATTCACA 


GTGAAGTAGG 


3000 




TAATAAGATG ATTGGTGCCA AGGTGAATGG CAAAATTGTA CCAATTGACT ATATTTTACA 


3060 


s 


AACAGGCGAT 


ATTGTTGAAA 


TACGTACTAG 


TAAACATTCA 


TATGGACCAA 


GTCGTGATTG 


3X20 




GTTGAAAATT 


GTTAAATCGT 


CTAGTGCCAA 


AGGTAAAATT 


AAAAGTTTGT 


TCAAAAAACA 


31B0 


10 


AGATCGTTCA TCTAATATTG AAAAAGGCCG AATGATGGTT GAAGCTGAAA TAAAAGAGCA 


3240 


AGGATTTAGA 


GTCGAAGATA 


"m*TO Af AOA 


HAAAAATATT 
unnnnAiAi x 


X XV9X Xn 


ATT2A A A A ATA 
AluAAAAAiA 


3300 




TAACTTTGCA 

w AAA V Sp J » 


AATGAAGATG 




Anf^TY^T A fV3 A 
>lvJ*— XV? X AVtVxA 


X X X 


luALAlLL X X 


3360 


15 


nwVNU X >J X X 


A ATA A A 

A/VX<*WW"VX X#W% 


ottsaa AnAfA 


AVAi 1A1 X X XA 


/"I TV fpTV ft TV IV TV 


GTGCTTTAAA 


3420 




TfiAAnnAr* a & 


uAAu X X AV.uA 


AAXV1AX XuCC 


TAX l AAAGAC 


IV TV ^*TV M V <TV imtll 

AAGATGATTA 


CTGATAGTGG 


34B0 




X \J X w lAlu XA 


GAAGGTTTAG 


JV IV TV IVIV^fPTi/'Wfl 

AAAATGTACT 


TATCAAGTTG 


TCAAAATGTT 


GTAATCCTAT 


3S40 


20 




UAX A llTjTAu 


GTTATATCAC 


CAAAGGTCAC 


GGTATTAAAG 


TACATCG CAC 


3600 




TviATTGCCCA 


AATATTAAGA 


JV «• t TV 

ACGAAACTGA 


ACGACTAATT 


AATGTTGAAT 


GGGTAAAATC 


3660 




ft 7V A TV r*' TV f**V* >, /* - '» TV 

AAAAQAUwGA 


*v /"wi tv 7v Tv tv iv #t% 
ACTCAAAAaT 


ATCAGGTTGA 


TTTAGAGGTA 


AtGCGTATGA 


CCGAAATGGC 


3720 


25 


1 X \» 1 .iwwi X\» 


AAGTACTACA 


AGCTGTTAGC 


TCGACAGCCG 


GCAATTTAAT 


TAAAGTTTCA 


3780 




VjrVviAJv X X V_M.vj 




7A TV STV^OTi 7A*PTA 

AAAXbLAA 1 A 


TV *T»TV TV TV <T*TA rr*P7k 

ATAAATATTA 


GTGTCATGGT 


GAAAAACGTG 


3840 


30 


4"tnX\Jt/VX UX X X 


/v X X v x x 


Art & A A &P ATf* 


TV TV TV f"»fv TA (*WPTP 

AAAUAAUl XI? 


GTGATGTTTA 


/*"* TV /"IT* JV TV r^TV 

TACAGTAACA 


3900 


n\Jn\I XXX VSVArt 


APTAf! AflfiTC 

l/UJ/VJU X V7 


fAAAATATTIA 


nnvj Inu X X \3 X 


ACAAAGAGTT 


AAAGAAGCAT 


3960 




CGGTGACGAA 


TGATACATTA 


AATAATPAA A 




ATATTGTTTA 


TTAGTCGGTA 


4020 


35 


TCGGTCAGAA 


CTCTACAGAG 


CAAGATGCAG 


ATGTAATTGC 


AAAGAAAATT 


GCTAATGCAA 


4080 


GATTATTTGA 


AGATGACAAT 


AATAAATTAA 


ACTTTAATAT 


CCAACAAATG 


AATGGTGAAA 


414 0 




TACEATCAGT 


TTCACAATTT 


ACTCTCTATG 


CAGATGTAAA 


AAAAGGTAAC 


CGTCCAGGTT 


4200 


40 


TCTCAAATTC 


TAAAAATCCT 


GATCaAGCGG 


TAAAAATTTA 


TGAGTATTTT 


AATGcaTGCG 


4260 




CTACGAGCGT 


ATGGTCTTAC 


TGTGAAAACA 


TCTGAATTTG 


GAACACACAT 


GAATGTTAGC 


4320 




ATAAATAATG 


ATGGTCGAGT 


CACTATTATT 


TATGAAAGTC 


AGGACGGCAA 


AATTCAATGA 


4380 


45 


AAAAAATAGA 


GGCATGGTTA 


TCTAAAAAGG 


GTCTTAAAAA 


TAAACGTACT 


CTAATAGTAG 


4440 




TGATTGCCTT 


TGTCTTATTT 


ATCATCTTTT 


TATTTTTATT 


GCTGAATAGC AATAGTGAAG 


4500 




ATAGTGGGAA 


CATCACGATA 


ACTGAAAATG 


CTGAATTACG 


TACAGGTCCA 


AACGCTGCGT 


4560 


SO 


ATCCAGTCAT 


ATATAAAGTT 


GAAAAAGGTG 


ACCATTTTAA 


AAAGATTGGT 


AAAGTAGGTA 


4620 




AATGGATTGA 


AGTTGAAGAT 


ACATCCAGTA 


ATGAAAAAGG 


TTGGATAGCT 


GGATGGCACA 


4680 
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TAGTGCTTGA 


TCCTGGTCAT 


GGAGGTAGTG 


ACCAGGGTGC TTCAAGCAAT ACTAAATATA 


4800 




AAAGTTTAQA 


AAAAGATTAT 


ACGTTGAAAA 


CAGCAAAAGA ATTGCAGCGT 


ACTTTAGAAA 


4860 


5 


AAGAAGGCGC 


AACTGTTAAG 


ATGACAAGAA 


CAGACGATAC ATATGTTTCA 


CTAGAAAATC 


4920 




GTOATATCAA 


AGGCGATGCC 


TATTTGAGTA 


TAGATAATOA TGCGTTAGAA TCATCTAATG 


4980 


10 


CAAATGGAAT 


GACaGTTTAT 


TGGTATCATG 


ATAATCAAAG AGCTTTAGCA 


GATACGTTAG 


S040 


ACGCTACGAT 


TCAGAAGAAA 


GGTCTACTTT 


CTAATCGCGG TTCAAGACAA 


GAAAATTATC 


5100 




AAGTGTTAAG 


ACAAACAAAA 


GTTCCTGCTG 


TTTTATTAGA ATTAGGTTAT 


ATTAGTAACC 


5160 


15 


CAACTGATGA 


AACGATGATT 


AAAGATCAAT 


TACATAGACA AATTTTAGAA 


CAAGCAATTG 


5220 




TTGATGGCCT 


TAAAATTTAT 


TTTTCTGCGT 


AGGGCTTGCA AAAATATGTG 


AAAGTAGTTA 


5280 




TCATTGATAT 


TGAATTTTAT 


AACTAAAACC 


GTTAGTATTC TTGAAATGGT 


AAATGAAATA 


5340 


20 


GGTAGCAATC 


TAACTAAGAT 


TGTGTAGGAA 


TATAATCCAT AGACTGAAAG 


ATTATGCTGA 


5400 




GTAGTTTATA 


TACATTGAAC 


ACAAGAAGAG 


GTGCTTTATG AAAAGTAAAG 


CCGTTAAACG 


5460 




TACGTTaAAC 


GTTTTGAGTG 


GGTTTATTAA 


ATGCACGCTT ATAAAAAGTA 


ATGATGATTA 


5520 


25 


CAATTAGGCA 


TGTTTTTTAA 


ACCA 






5544 



(2) INFORMATION FOR SEQ ID NO: 111: 

"(i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH: 1067 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

3S 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 111: 
AAAAGATTGC AAATATAAAT GGCATGTTTA ATATGTTAGA ACAACAAATC ATTCATAGCC 60 

4Q AAGATATGGC T CATTTT AG A AGTGAATTTT TTTACGTCAA TCATGaGCAT CGAGAAAACT 120 

ATGAAgCACT CCTAATTTAT TACAAAAATA GTATCGACAA TCCTATTGTA GATGGTGCAT 180 
GTTATATTTT AGCCCTACCT GAAATTTTCA ATAGTGTTGA TGTTTTCGAA TCAGAGTTAC 240 

45 CATTTTCATG GGTATATGAT GAAAATGGCA TTACCGAAAC AATGAAATCA CTTAGCATTC 300 

CATTACAATA TTTAGTTGCA GCAGCTTTAG AAGTAACTGA TGTGAATATA TTTAAGCCTT 360 
CAGGATTTAC AATGGGAATG AATAATTGGA ATATTGCTCA AATGCGAATC TTTTGGCAAT 420 

60 ATACAGCAAT TATTAGAAAA GAAGCACTAT AACATTAATA ATTAATTAGC TATAAAGATG 480 

ATTCACAACA ATCATCTTTA TAGCTTTTTT ATGTCTAATT ATTTTTGAGG AAAATmACAA 540 

55 
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AATTTTATGT TTTCAAAAGT AAACAATCAA AAGATGTTAG AAGATTGCTT CTATATAAGA 660 

AAGAAAGTCT TTGTAGAAGA ACAAGGCGTC CCTGAGGAAA QTGAAATTGA TGAATATGAA 720 

5 TCTGAATCTA TTCACCTCAT TGGATATGAT AATGGACAGC CAGTTGCCAC TGCTCGAATA 780 

CGCCCTATTA ATGAAACAAC TGTCAAAATA GAACGAGTAG CTGTGATGAA ATCACATCGT 840 

GGACAAGGAA TGGGTAGAAT GCTTATGCAA GCTGTAGAAT CATTAGCTAA AGATGAAGGT 900 

10 

TTTTACGTAG CTACTATGAA TGCCCAATGT CATGCTATCC CATTTTATGA AAGTTTAAAC 960 

TTTAAAATGA GAGGTAATAT ATTTCTTGAG GAAGGCATCG AGCATATTGA AATGACAAAA 1020 

AAGTTAACCT CGCTTAATTA AAAAAAGTTG TATCTATTTT AGAAACA 1067 

15 

(2) INFORMATION FOR SEQ ID NO: 112: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 18613 base pairs 
20 (B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 112: 



30 



35 



40 



AAGACGtAtG 


ATAACAACAA 


TACgTGTAGT 


GAAAGATTTT 


AATCTACATA 


TTACTGACAA 


60 


AGAATTCATT 


GTATTTGTTG 


GACCATCGGG 


ATGTGGTAAA 


TCAACAACAT 


TACGAATGGT 


120 


TGCTGGACTA 


GAGTCTATCA 


CATCTGGAGA 


TTTTTATATT 


GATGGGGAAC 


GCATGAACGA 


1B0 


TGTTGAACCA 


AAGAATAGAG 


ATATTGCGAT 


GGTATTTCAA 


AACTATGCAT 


TATATCCACA 


240 


TATGACTGTT 


TTTGAAAATA 


TGGCATTTGG 


GCTAAAGCTA 


CGTAAAGTAA 


ATAAAAAAGA 


300 


GATTGAACAA 


AAAGTTAATG 


AAGCAGCTGA 


AATATTAGGA 


TTAACTGAGT 


ATCTTGGTCG 


360 


TAAACCAAAA 


GCGTTATCTG 


G CGGACAGCG 


TCAACGTGTT 


GCTTTGGGCA 


GAGCTATTGT 


420 


TAGGGATGCG 


AAAGTCTTTT 


TAATGGATGA 


ACCATTATCG 


AATCTTGATG CGAAyTtCGA 


480 


GTACAAATGC 


GCACAGAAAT 


ATTGAAATTA 


CATAAGCGAC 


TTAATACTAC 


GACAATTTAT 


540 


GTTACACATG 


ATCAAACTGA 


AGCATTGACG 


ATGGCTAGTC 


GAATTGTTGT 


TTTGAAAGAT 


600 


GGCGACATTA 


TGCAAGTCGG 


CACACCTAGA 


GAAATATATG 


ATGCCCCTAA 


TTGCATATTT 


660 


GTGGCGCAAT 


TTATCGGCTC 


ACCAGCAATG 


AATATGTTGA 


ATGCTACAGT 


TGAAATGGAC 


720 


GGATTGAAGG 


TAGGAACACA 


CCATTTTAAA 


TTACATAATA 


AAAAATTTGA AAAGTTAAAA 


780 


GCTGCTGGCT 


ACTTAGACAA 


GGAAATTATT 


TTAGGTATTC 


GAGCTGAAGA 


CATTCATGAA 


840 


GAACCAATAT 


TTATTCAAAC 


TTCTCCAGAG 


ACACAATTTG 


AATCTGAAGT 


AGTTGTATCC 


900 
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AAATTAGATT CAAGAACTCA AGTGATGGCG AACGACAAQA TTACACTAOC ATTTGATATG 1020 
AATAAOTGTC ACTTTTTTGA TGAAAAAACA GGAAATCGTA TCGTCTAAGG GGGAGTATTC 1080 
5 ATGTCTAAAA TTTTAAAATG TATCACGTTA GCCGTGGTAA TGTTATTAAT CGTAACTGCA 1140 

TGTGGCCCTA ATCGTTCGAA AGAAGATATT GATAAAGCAT TGAATAAAGA TAATTCTAAA 1200 
GACAAGCCTA ACCAACTTAC GATGTGGGTG GATGGCGACA AGCAAATGGC GTTTTATAAA 1260 

10 

AAAATTACGG ATCAATATAC TAAAAAAACT GGCATCAAAG TAAAGCTTGT AAATATTGGT 1320 
CAAAATGATC AACTAGAAAA TATTTCGCTA GACGCTCCTG CAGGAAAAGG TCCAGATATC 1380 

1S TTTTTCTTAG CACATGATAA TACTGGAAGT GCCTATCTAC AAGGCTTAGC TGCTGAAATC 1440 

AAATTATCAA AAGATGAGTT GAAAGGTTTC AATArGCAAG CACTTAAAGC GATGAATTAT 1500 
GACAATAAGC AACTAGCATT GCCAGCTATC GTTGAAACAA CCGCACTTTT TTATAATAAA 1560 

20 AAATTAGTGA AAAATGCACC GCAAACGTTA GAAGAAGTTG AAGCTAATGC TGCCAAACTA 1620 

ACTGATAGTA AAAAGAAACA ATACGGTATG TTATTTGATG CTAAAAATTT CTATTTTAAT 1680 
TATCCGTTTT TATTCGGCAA TGATGATTAT ATTTTCAAGA AAAATGGCAG TGAATATGAT 1740 

25 ATTCATCAGC TAGGACTAAA TTCAAAACAT GTCGTCAAGA ATGCTGAACG ATTACAAAAA 1800 

TGGTACGACA AAGGGTATCT TCCTAAGGCA GCAACACATG ATGTCATGAT TGGTCTTTTT 1860 
AAAGAAGGAA AAGTAGGACA ATTTGTCACT GGACCGTGGA ACATTAATGA AT AT CAAG AA 1920 

30 

ACGTTTGGTA AAGATTTAGG AGTAACAACA TTACCTACAG ATGGTGGCAA ACCTATGAAA 1980 
CCATTT CTAG GTGTACGTGG TTGGTATTTA TCTGAATATA GTAAACATAA GTATTGGGCT 204 0 

AAAGATTTAA TGCTGTATAT CACTAGTAAA GATACATTAC 

3S 

AGCGAfiAlTA CTGGACGTGT TGACGTGAAA TCATCTAATC 

AAGCAAGCAC GTCATGCTGA ACCGATGCCT AATATTCCTG 
40 CCGATGGGCA ATGCAAGCAT ATTTATTTCA AATGGTAAGA 

GAGGCGACGA ATGATATAAC GCAAAATATT AAGATTCTTC 

AAAGGAGATT AGTTATGACG AAACGTAACC CT AAATT AG C 
45 CTGGTTTGGG ACAGTTTTAT AATAAAAGAC CCATTAAAGG 

TCATCAGTTT TATTTCTGTT TTTTATAGCT TTTTAAATAT 

CATTAGGGAC AGTACCTAAG TT AG A CG ATT CTCGTGTCTT 

SO 

CTATCTTACT CGTTGCTTTC GCAATCATGC TATATATCAT 
GTAATGCTGA ACGATTTAAT CGCAATGAGG AAATAAAGGA 

£5 



AAAAATATAC AGATGAAATG 2100 

CAAATTTAAA AGTGTTTGAA 2160 

AAATGCGACA AGTTTGGGAA 2220 

ATCCTAAACA AGCGTTAGAT 2280 

ATCCATCACA AAATGATAAG 2340 

GGCATTATTA TCTGTTATAC 2400 

GACGATATTT TTTATCTTTT 2460 

TGGTTTTTGG GGATTGTTCA 2520 

ACTTGCACAA GGTATTATTT 2580 

TAATATTTTA GATGCATATC 264 0 

TCCGAAGCGC GTATGGTGGC 2700 
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TGTAGTTGTA TTTCCATTAA TAyyTATGTT TGGAGTAGCA TTTACAAATT ACAATTTATA 2820 

CAACGCGCCT CCGAGACACA CATTAGAATO GGTTGGTTTA GATAACTTTA AAACGTTATT 2880 

6 CACAATTGCC GTTTGGCGTA AAACATTTTT CAGTGTTATT ACTTGGACAT TAGTATGGAC 294 0 

GCTTGTTGCA ACGACACTTC AAATTGCATT AGGGCTGTTT TTGGCAATTA TTGTAAATCA 3000 

CCCTGTCGTC AAAGGTAAGA AATTTATCCG TACTGTGTTA ATCCTACCTT GGGCTGTACC 3060 

10 

ATCATTTGTG ACAATTTTAA TATTTGTAGC GTTATTTAAT GATGAATTTG GTGCGATAAA 3120 

TAATGATATT TTGCAACCTT TATTAGGTGT AGCACCAGCA TGGTTAAGTG ATCCGTTTTG 3180 

1S GGCAAAAGTG GCATTAATCG GCATTCAAGT ATGGCTTGGA TTCCCATTTG TCTTTGCACT 3240 

GTTCACTGGA GTACTGCAAA GTATTTCATC AGATTGGTAC GAAGCAGCAG ATATGGATGG 3300 

TGCGTCTAGT TGGCAAAAGT TTAGAAACAT CACATTCCCG CATGTCATTT ACGCCACAGC 3360 

20 GCCATTGTTA ATTATGCAAT ATGCAGGTAA TTTCAATAAT TTTAATCTTA TTTATCTATT 3420 

TAATAAAGGC GGTCCACCAG TGTCAGGGCA GAATGCTGGT AGTACAGATA TCTTGATATC 3480 

TTGGGTGTAT AATCTGACAT TTGAGTTTAA CAACTTCAAC ATGGGTGCAG TTGTGTCATT 3540 

25 AATTATTGGA TTTATTGTTG CTATTGTCGC ATTTATTCAA TTCAGACGTA CAAGTACGTT 3600 

TAAAGATGAG GGAGGTTTAT AAGATGACAA AGAAGAAAAA CATATTAAAA GCAATCGGTA 3660 

TTTACAGTTT TATAGCGATG ATGTTTGTCA TCATTTTATA TCCACTACTG TGGACATTTG 3720 

30 

GCATTTCCCT TAATCCAGGT ACGAACTTGT ATGGTGCCAA AATGATACCA GACAATGCAA 3780 

CATTTAAAAA TTATGCATTC TTACTATTCG ATGACAGTAG TCAATACCTG ACTTGGTATA 3840 

AAAATACGCT TATCGTAGCA TCTGCAAATG CACTGTTTAG TGTGATATTT GTCACGTTAA 3 900 

35 

CAGCATATGC TTTTTCTAGA TATCGCTTTG TTGGTCGTAA ATACGGGCTG ATTAGATTTT 3960 

TGATOTTACA AATGTTCCCT GTATTAATGG CAATGGTCGC AATCTATATT TTGCTAAATA 4020 

40 CAATTGGATT ATTAGATTCT TTATTTGGAC TAACACTGGT ATATATTGGT GGATCAATAC 4080 

CGATGAATGC CTTTTTAGTG AAAGGTTACT TCGATACGAT TCCAAAAGAA CTTGATGAAT 414 0 

CTGCCAAAAT TGATGGTGCA GGG CATATGC GTATTTTCTT ACAAATTATG CTTCCATTAG 4200 

45 CTAAGCCGAT TTTAGCAGTT GTTGCTTTGT TCAATTTTAT GGGGCCATTT ATGGACTTTA 4260 

TATTACCTAA AATACTATTA AGAAGTCCTG AAAAATTCAC ATTAGCAGTT GGATTGTTCA 4320 

ACTTTATTAA TGATAAGTAT GCAAATAATT TCACAGTGTT TGCAGCAGGG GCAATTATGA 4380 

SO 

TTGCAGTACC TATAGCAATC GTATTCTTGT TCTTGCAACG CTATTTAGTA TCAGGTTTAA 444 0 

CAACAGGTGC GACAAAAGGT TAGTTTGAAA TTAGGAGTGG GGCAGAATTG ATAAAGAACC 4500 
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OGGTGTGGTG GTATTGCGAA TGGCAAGCAC ATGCCAAGTT TACAAAAAGT 


TGAAAATGTT 


4620 




GAAATGATCG 


CATTTTGTGA 


CGTAGACATT 


TCGAAAGCAG CGAGTGCGGC 


AGAAGCATAC 


4680 


s 


GGAACTGACA 


ATGCAAAGGT 


TTATGATGAT 


TACAAAGCAT TGTTAAAAGA TGACACGATT 


4740 




GATGTTATCC 


ATGTTTGTAC 


GCCAAATGAC 


TCGCATTGTG AAATTACTGT 


AGCAGGGTTG 


4600 


10 


CATGCTGGTA 


AACATGTGAT 


GTGTGAAAAA CCAATGGCTA AAACGACAGC AGAAGCTCAA 


4660 


AAAATGATAG 


ATACAGCTAA 


ATCAACAGGT 


AAAAAATTAA CAATAGGTTA 


TCAAAATCGT 


4920 




TTCCGAGCAG 


ATAGTCAATT 


TTTACATCAA 


GCAGCGCAAC GTGGCGACTT 


AGGAGACATT 


4980 


1S 


TACTTCGGAA AGGCACATGC 


CATTCGTCGT 


CGAGCAGTAC CAACATGGGG 


TGTCTTTCTA 


5040 




GACGAAGAAG 


CTCAAGGTGG 


AGGACCATTA 


ATCGATATCG GTACACACGC 


TTTAGATTTA 


5100 




ACGTTATGGA 


TGATGGATAA 


TTATGAACCA 


GAATCAGTGA TGGGTTCAAC ATTCCATAAA 


5160 


to 


TTAAATAAAC 


AGCATCATGC 


GGCAAACGCT 


TGGGGTTCAT GGAATCCAGA 


TGAATTTACA 


5220 




GTTGAAGATT 


CTGCGTTTGG 


ATTTATTAAA ATGAAGAATG GAG CG A CG AT 


CATTTTAGAA 


5280 




TCCGCTTGGG 


CGATTAATTC 


TTTAGAAGTG 


GATGAGGCAA AATGTTCATT 


ATCAGGAACT 


5340 


25 


AAAGCAGGTG 


CTGATATGAA 


AGATGGTCTA 


CGTATTCATG GTGAAGACAT 


GGGTACACTT 


5400 




TATACCAAAC 


ACGTTGAATT 


GGAAAACAAA 


GGCGTCGACT TTTATGAAGG 


TAATGAAGTG 


5460 




GATGAAGCTG 


AAGAAGAAGC 


AAAAGCTTGG 


ATTGATGCAG TTGTAAATGA 


TACTGAACCA 


5520 


30 


GTTGTGAAAC 


CGGAACAAGC 


AATGGTAGTT 


ACAAAAATTC TTGAAGCGAT 


TTATCAGTCT 


5580 




GCAAAATCAG 


GCAAAGCAAT 


TTACTTTGAA 


TAACATCATA CGGTAAGGAG 


GCACATCATG 


5640 


35 


ACAAAATTAA 


AAGTTGGTGT 


GATAGGTGTT 


GGTGGTATTG CACAAGACCG 


TCATATTCCA 


5700 


GCATTGCTGA 


AACTCAAAGA 


CACAGTCTCA 


TTAGTTG CAG TACAAGATAT 


TAATACAGTG 


5760 




CAGATGATTG ATGTTGCGAA gCGCTTTAAT 


ATAC CTCATG CAGTTGAGAC 


ACCTAG CGAG 


5820 


40 


CTGTTTAAAC 


TTGTTGATGC 


GGTGGTCATT 


TGTACACCTA ATAAATTCCA 


TGCTGATCTT 


5880 




TCTATAGAAG 


CATTGAACCA 


TGGTGTCCAT 


GTATTGTGTG AAAAGCCAAT 


GGCGATGACG 


5940 




ACGGAAGAGT 


GTGATCGCAT 


GATTGAAGCG 


GCTAATAAAA ATCACAAATT 


ATTAACTGTC 


6000 


45 


GCATATCATT 


ATCGTCACAC AGATGTGGCA ATTACTGCTA AAAAAGCAAT 


TGAATCAGGT 


6060 




GTGGTTGGTA 


AACCTTTAGT 


AGCACGTGTA 


CAAGCGATGC GTAGGCGTAA 


AGTGCCTGGC 


6120 




TGGGGTGTTT 


TTACCAATAA 


AGCGTTGCAA 


GGTGGCGGTA GTTTAATCGA 


TTATGGTTGC 


6180 


50 


CACTTGTTAG 


ACTTATCTTT 


GTGGCTACTA 


GGTAAAGATA TGGTGCCGCA 


TGAAGTGCTA 


6240 




GGAAAAACAT 


ATAATCAATT 


GAGCAAACAA 


CCGAATCAAA TTAATGATTG 


GGGAACATTT 


6300 
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OCAAGCATGC AGTTTGAATG TTOGTGGTCT 

AGTTTATCAG GAGAAGATGG CGOTATCAAT 

5 

TTTGGAACTA TTTTTGAAAG CAAAGCTAAT 

AGACAGGCGC GTAACTTTGT CAATGCGTGT 

GAAGAAGCAC GCAATGTAAA TGCCCTTATA 

10 

AAGAGCATAC AACTTTAATG ATTATCATAT 
GAGTGCTTTT CAATGAAAAT AGGTGTATTT 

1S GATATGTTAG ATTATGTCTC AGAATCTGGA 

AACCCAGGAG ATAAATTTTG TAAGTTAGAT 
GCATTTATGA AGTCAATCAC AGACAGAGGC 

20 AATCCAATTT CTCCAGATCC GATAGAAGCG 

ATCCGTTTAG CAAATCTATT AGACGTGCCA 
TCAGATGATA CCGCTAAAAA GCCTAATTGG 

25 GAAATTTATG ATTATCAGTG GAATGAAAAG 

TTTGCAAAAG AGCAAGATGT AAAAATTGCC 
ACACCATATA CAATGTTGAA GTTACGTGAG 

30 

GATCCTAGTC ATCTATGGTG GCAAGGTATT 
CAAGCAAATG CAATTCATCA CTTCCATGCT 
AATATGTATG GTCTAACTGA TATGCAACCA 

35 

TTCCGTACAG TTGGTTATGG ACATAGTCCA 
ATTATTAATG GATATGATTA TGTATTAAGT 

40 GAAGAAGGTT TCCAAAAAGC TTGTCAAACT 

GCAGACATGT GGTGGGCATA ATACGAACTC 
ACTGGTGGCA GTGTTGAATA AATGCATATG 

45 TTAAATCAAG TCATTGTTTG TAAAGAAGGT 

TACCCATTCA CAGTAACAAT CCTCACCATT 
GGTATATGAT AATAAAAAAA GCCTGTTGTC 

SO 

GGTTTCTGAA TATAATATTT CAGAATGCAC 
TGATGACAGG CTTTCATCTT TTTAAATATT 
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GGAAATATCA AAGAAGATAA 


GGTTCACGTT. 


6420 


TTATTTCCAT 


TTGAAATATA 




6480 


GTTGAGCATA 


ACGAAGACAT 


TGCTGGTGAG 


6540 


TTAGGGATAG 


AAGAGATTGT 


^PTP TV TV K f^t^f* 

GCJTGAAACCG 


6600 


GAAGCGATTT 


ATCGTAGCGA 


TCTTGATAAC 


6660 


ATGATACAAA ATTCTCAATA 


TAAAAAGAAG 


6720 


TCAGTATTAT 


TTTACGATAA 


AAATTTTGAA 


6780 


TTGGATATGA TTGAAGTTGG 


AACAGGTGGT 


6640 


GAGTTGTTAG 


AAAATGAAGA 


CAAGCGCCAA 


6900 


TTACAAATAA 


GTGGTTTCAG 


TTGTCATAAC 


6960 


AAAGAAGCCG 


ATGAAACGTT 


ACGTAAAACA 


7020 


GTTGTTAATA 


CATTTTCTGG 


CATTGCAGGA 


7080 


CCTGTTACAC 


CTTGGCCAAC 


AGCCTACTCT 


7140 


TTGATACCAT 


ATTGGCAAGA 


TTTAGCTGAG 


7200 


ATAGAGTTGC 


ATGCAGGATT 


TTTAGTG CAT 


7260 


GCTACAAATG AATATATCGG 


TGCTAACTTA 


7320 


GACCCAATTG 


CTGCGATTCG 


CATATTAGGC 


7380 


AAAGATACGT 


ATATTAATCA 


AGAAAATGTA 


7440 


TATGGTAACG 


TTGCGACAAG 


AGCATGGACA 


7500 


TATGTATGGG 


CAGATATCAT 


AAGTCAACTT 


7560 


ATTGAACATG 


AAGATCCTAT. 


TATGTCAGTA 


7620 


TTGAAATCTG 


TTAATATTTA 


CGACAAGCCA 


7680 


GAGGTTAGTC 


TGAAGTTTGT 


CTGAAGTAAG 


7740 


TCGCCAAGCC 


ATTGCCAAAA 


ATTTCACACC 


7800 


GTACTTTATA 


TAAGTATATA 


GCGATGGTCA 


7860 


GAAAAGAGTA 


TATAACCTTT 


TCAATAGTGA 


7920 


ACAATGGTCA 


TAGACACGAC 


ATACTTTAAA 


7980 


TTTAAAGATG 


GACGTCGATG 


TAGACTAAAG 


8040 


CATTAATTTC 


TCTTCTTGTT 


TAATACGTAC 


8100 
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TAATACACCG 


ATTAATTCAG 


GAATGATGTT 


TAAGAAGTAA TTTGGGTGTT 


TTGTAATTTT 


8220 




ATATAATCCA 


GATTTAATAA 


TAGGATGGTT 


AGGTAAAATG 


AATAATTTTA 


ATGTCCAAAT 


6280 


5 


ACCACCTAAA 


GTTTTAATAA 


CCATAAATAA 


CATGATATAA GCAAAGATTA ATATAACTAA 


8340 




GCCAATACCA 


TTTGCAAAGC 


TAAATGTATC 


TTTATTAATA 


AATGCCTCTA 


CACCAGCCAA 


8400 


1 1\ 

1U 


TACATAAATT 


AAAACGTGTG 


TTATTGCTAA 


AAACTTCGAA 


TTTTTAACGC 


CATATTCAAC 


8460 


TGCACCGTCT 


GCTTTTAATT 


GTTTTGAGTG 


ATTAATAGAT 


ATCTTTAAGC 


TGACAAGTCT 


8520 




GATACAGAAA 


AAGATAAGTA 


ATATAGATAG 


AATCATGATG 


TCCTCCGTCA 


TTATGTCATA 


8580 


15 


TGTATAAGCG 


TTGATTTTGA 


CAACATAAAG 


TATTTTATAG 


ATAAAGCTTG 


TCAAATACTA 


8640 




TTAACTATTT 


ATTAATTTTA 


GTACATAAAT 


ATGTTTCTAA 


GTATGTGTTT 


ATGTTCAGTA 


8700 




TTTTGGATAA 


TTTAATAATT 


TTAAGGATAT 


TAAGCGCTTA 


CACCGACGTG 


ATATATTTGG 


8760 


20 


CTTAACGAAA 


ATGATTGAGG 


TGACAGAGAT 


GAACTTTTTT 


GATATCCATA 


AGATTCCGAA 


8820 




CAAAGGCATT 


CCATTATCGG 


TACAACGTAA 


ATTATGGCTT AGAAACTTCA TGCAAGCTTT 


8880 




CTTCGTAGTG 


TTCTTTGTTT 


ATATGGCTAT 


GTATTTAATT 


CGAAACAACT 


TTAAGGCGGC 


8940 


25 


ACAACCGTTT 


TTAAAAGAGG 


AAATTGGATT 


ATCTACATTA 


GAACTTGGTT 


ATATCGGATT 


9000 




AGCATTTAGT 


ATCACGTACG 


GTTTAGGAAA 


AACATTACTT 


GGATATTTTG 


TCGATGGACG 


9060 




TAACACAAAA 


CGTATTATCT 


CGTTCTTACT 


TATCTTATCT 


GCGATTACAG 


TTTTAATTAT 


9120 


30 


GGGATTTGTT 


TTAAGTTACT 


TTGGTTCTGT 


AATGGGATTA 


TTAATTGTAC 


TTTGGGGACT 


9180 




TAACGGGGTG 


TTCCAATCAG 


TTGGTGGACC 


TGCAAGTTAT 


TCAACGATTT 


CAAGATGGGC 


9240 


35 


GCCAAGAACG 


AAACGTGGCC 


GATACTTAGG 


ATTCTGGAAT 


ACATCACATA 


ATATCGGTGG 


9300 


TGCCATAGCA 


GGTGGTGTTG 


CACTTTGGGG 


TGCTAATGTA 


TTCTTCCATG 


GAAATGTTAT 


9360 




AGGGATGTTC 


ATTTTCCCAT 


CGGTGATTGC 


ATTACTTATT 


GGTATCGCAA 


CATTATTTAT 


9420 


40 


CGGAAAAGAT 


GATCCGGAAG 


AATTAGGATG 


GAATCGTGCT 


GAAGAAATTT 


GGGAAGAGCC 


9480 




GGTCGATAAA 


GAAAATATTG 


ATTCTCAAGG 


TATGACGAAA 


TGGGAGATCT 


TTAAAAAATA 


9540 




TATCCTGGGA 


AATCCTGTTA 


TATGGATTCT 


ATGTGTTTCA 


AACGTCTTTG 


TATACATTGT 


9600 


45 


ACGAATCGGT 


ATTGATAACT 


GGGCACCGTT 


ATATGTGTCA 


GAGCATTTAC 


ACTTTAGTAA 


9660 




AGGCGATGCA 


GTTAATACGA 


TATTCTACTT 


TGAAATTGGT 


GCATTAGTTG 


CAAGTTTATT 


9720 




ATGGGGCTAC 


GTATCAGACT 


TATTAAAAGG 


TCGTCGTGCA 


ATTGTAGCTA 


TTGGCTGTAT 


9780 


SO 


GTTTATGATT 


ACATTTGTTG 


TCTTATTCTA 


CACAAATGCT 


ACAAGTGTCA 


TGATGGTTAA 


9840 




CATTTCATTG 


TTTGCATTAG 


GTGCGTTAAT 


CTTTGGTCCG 


CAATTATTAA 


TTGGTGTATC 


9900 
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CGCGTATCTA TTCGGTGACT CAATGGCGAA 

ACGTAACGGT TTAAACATCT TTGGATATAC 

5 

CTTCTATGTT GCATTATTCC TAGOCATOAT 

AAAGAAAATT AGAAGTTTAA AAATTTAATA 

TGCAATATAG TTGGCAATCC TGCCCCGACG 

10 

TTCTACCCTT GCAAATATAT CATCTCTATG 
AAGTATCCTT ATTTGCCCGA CTTAGGGTGA 

1S ATATAGOGGT GTCAATATTG TAGGGAGTAT 

ACTGAAAGAA AAGTGAAAAC TTCTCTATCA 
GCCATAATCA TTAGTTATGT GCTAATCTAT 

20 ATTTGTAAAT ATTTTTTAAA ATGATAGCTA 

TCTGCAATTT CATAGTGTTT GTAATGTCGA 
TAGOGATTTA AATAATCGAC AATTGTAATA 

25 TACGATTCAC TAACATCGAT ATGTTGAATT 

GATTGCTTAA TTTGATCCAC AATCTGGTTT 
AGTGGTTGGA AGGCATCATG ACAAGATGCT 

30 

AATAAGGTAC GGACAAGTCT TCCTAAAATA 
AATAAATAAT CAAGAACATG ATGTTGAATG 
CTCGATAATA TGATGACATT ACAATCTAGA 

35 

TTTTTACGTG GCATACGAAT ATCAGTAATT 
GATftATGCTT CAACACCATC TTTAGCAGTG 

40 GGAATGATTT GCTTTAATCC TTCTCGAATA 

AACATCTACA TTCCCCCTTG AAAGTGGTAT 
CTTTGAAAAA ATATGGAGTC GTGCATGTGA 

45 ATGATTTAAT CCCAAATGCT TAGTATCAAA 

TTGCAGGCGA GATGACGACA TCCCGATACC 

ACGTGCCAAT GTCAGGCGTA TAGTAATGTC 

SO 

AGCATTTTCT ATGAGTGGCT GAAGCATCAT 

AGAACTTTCA ATATGGAGCT TAATCATGTC 

55 



AGTTGGTTTG GCGGCTATTG CTGATCCAAC 10020 

ATTAAGTGGA TGGACAGATG TTTTCATCGT 10080 

TCTATTAGGA ATCGTTGCTT TCTATGAAGA 10 140 

TAAATCGGAT TAAAAGTATC GCCAATCTAT 10200 

GCATGTGCGT GAAGAGATGA AAGATACTGC 10260 

TCTCGGGGCA GATCATAATT CCCTGTTATG 10320 

CTCAATGAAT TTACTCCTTA CAATAAAGAC 10380 

TGTTTTATAT TTAAACTCTC TAAAAAGCGG 10440 

GTCCGCTTTT TCATAGAACA AAATGGAGGC 10500 

TTTGCTTGCT TACAATAATC ACTTGGCGAC 10560 

AACATTTTAT ACTCTGAAAA GCCTACTTTG 10620 

TCTAACAATT GCAGAGATTG TAAAATACGA 10680 

CCAACATGAT CTTTAAATGT TCGCATCGCA 10740 

AAATCTGAAA CAGtCACTTT CGTTTGATAA 10800 

ACATAATAAT CATCGTATTC TACTTTTAAT 10860 

AAGCTACGGC CGTTCTGTGA TTGTTGCTCT 10920 

ACTTCTAATT GTGCATGGTC TACTGGTTTT 10980 

CCGGCTTTCA TATATTCAAA GTCATCGTAA 11040 

TGCGCAATAT CATTGAGTAA ATCGACGCCA 11100 

ACTAATTCTG GCTGATGTTG TTGAATTAGT 11160 

TATATTGTAT TGAAATGATA GTCTCCCCAA 11220 

ATTCGTTCAT CATCACAAAT AACTACCTTA 11280 

TTTATAACAA ATTAACGTAC CTTGATTACG 11340 

ACCATATTGA ATCATTGCTT TATTGTGTAA 11400 

TACATCATTA TTAAGAGATT GGCGTACATA 11460 

ATTGTCGCAA ACTAAAACAT GTAAATTCTG 11520 

CAATGACTCA GTATCTCTAC CATGTTTAAT 11580 

TTTACCAATT GTCTGGTGAC GCGCTTCTTC 11640 

ATCAAAACGG aTGTTTTGTA TTGCAACATA 11700 
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GTAACGTAAC ATTTGCGATA ATTGTTGGAC CACAGTTtGT GCTAATTTCG GAGATAACGT 11820 

AATTAAATAT TGTATTGTTT GCATCGTATT GAATAGGAAA TGAGGCTGGA ATTGGOGTTC 11880 

5 TATTTCCTTT AACTOAATAT CACGCAAGCG ACGTTCTGTA TGCTCGATAG AATGOATCAG 11940 

TTGCTCATTT GATTCAAATA AATCGTAAAT ATAATTATTA ATTTCTTCTA GTTCACTGTT 12000 

GTTTTTTAAA GGCGTATATG TACCTAGATG ACGATTTTTG GCATAGTAAA TTTTTTGAAT 12060 

10 AATCGTTTCG ATATCTTTTG TTTGTCGTTT AGCCATATTA TCTGCGCTAA TGAAACCAAA 12120 

TATTACTAGT AAAACAAGAA CTACGGCCAT AACAATTAAC AACGTGATAC CATCTTCAAT 12180 

GTTTTCATGT ATATCTTTAT AAATAATGAG ACGATGGTCA GCATGGTTTA ATTTTACAGA 12240 

15 

TTCATTCATA AATCCGAATT GTTGTGGTcT ATACTTTTCA CCTATAGTAA AACGGTCATC 12300 

GTTGG CGTAT AAAATATTGT CATATTGATC AmCGATAAGT GCGAATTGTC GGTTATCTTT 12360 

2Q CtTAATTTCA CTTAAACGTG GGGTGTtAGC CATATAAATt TTaAGCATAT ATGTACTATT 12420 

TTTGAATTTA AGCTGATGCG TTGAAAATAA ATACATATTT TTAGTGTTTA AATGTTCATA 124 80 

ATTATTGGTT ATAAACTGAT TTGGTCCAGA TAATTCATAA TAAAGTGTTG CGGGCTGTTG 12540 

25 GkGTATTAAT TTTAATAATT CACGTTTTGT AGCGGTCACA TCATGATGAT TTGyTAAATC 12600 

GAGCTCTTGA AACGAATTAT TATGCTGTGT AATAAATGTC TGAATCTGCT TTTCAGTATG 12660 

ATGTAAAGAT GACTGACTTT CATCAACATG TTGATGAATC GTACGATGCT CAATCCAAAT 12720 

30 ATAGATGGCA TAGAAGCTTA CTAGTCCAAT AATAATGACT AAAAATACTG GAAAAATAGT 127 80 

AGACnCAAAT AACGATCGTC TTAATTGATG TCTATAAGGT TTGTATGCCn TCATTGAATC 12840 

ATCTCGAAAA ATTTATGATG TGGAATATCC GGTAATTTAG ATTTCGGTAT TAAAGGTATG 12900 

35 

TTCTTAAGAT TTTCGATAGA CTGATCGCTT TGTTCACTAA CATCCTTTCG AATTGACTTG 12960 

GCATCGAACT CTGCAACTAA TCGTtGTTGT ACTGAGCGGC TTGTTAAATA TTGCACTAAC 13020 

TTTTTACGCT TAGGATGAGG GTGTGCATTT TTAACTAAAG CAATrCCATC AACATTTAAC 13080 

40 

ATTGTTCCTT CAATTGGATA AACGATTGAT ACAGGATAAC CTTTGTTTTT CCATGTGCGT 13140 

GCATCTTGTT CGTAGCTTAG AC CTGCGTAA TATTTACCTT TTGCAACATC TTCAATGACT 13200 

45 TTAGACGTCT TTGACAGTTG CATCGCATGG TTTTGGAATT GATGCACATC ACTTACTCGA 13260 

TGATGCATGC TATAAATAGC ACGCATATGT TGATAGCCTG TCGTTGTTGT ATTTGGATTT 13320 

GAGTACGCAA TTTTACCTTT AAGTATAGGT TGTAATAAAT CTTGATAACC TCGAATCTTA 13380 

60 ATATCTCCTT GTAAATCTGA ATTCACTACT ATAACTGTTG GCATTAATAG AAAACTAGTA 13440 

ACATATTTAT TGTTCGAGCG ATAATCCTCT AATTGCTGTG TTACAGATGT ATCTTGATAG 13 500 
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CCACGCTCCG AAAAATCTTC 




1 1 X v»ri/%MV»w* 


f r i ' R f 1 w 1 " i r r 1 yj* 

\* X Ml* A XuivJ X 


nut/* X \« x v» x 


4 4f <v/\ 

13620 




TTAATTTCAA TTTTGACATG 


CTCTTGTTTT 






nUUAn 1 v—rl/vJ 


13680 


5 


TTTGATTGAT ACGGAGAATA 


AACTGTTAAT 


Awtl ill 1A1 


WVvUAX XLAuA 


ur lunLuLVj X A 


13740 




TTAGCGCATG 


CTGaTAAAAA 


AATGAGAAAT 


AATA&CAAJlsA 


lAlivwil 111 


luAl X X Vji\ 1Vl» 


13800 


10 


ATATCCCATC 


AATTCTATGT 


ATATTTTAAT 


ACAATAAl 1 A 


mm /"•/■^■JV JVmlV TV IV 

TAGCAATAAA 


/"v^ jv JV TV 

TGACG CAT AA 


13860 


GTAATGTTAA ATATTTAGAA ATGTTTATAG 


ATGACTTGTT 


JV IV ^ JV 4*^1 'IWIV * 

AAGACGTTGC 


JV M IV IIV/ VIIMIW Mil/ • 

AAATGTTGTG 


13920 




ATAGCACAAA ATTTTTGTTT 




TTTACCGAGG 


CTGTAAAATC 


AAACTGTTAT 


13980 


1S 


ATTTTATTTG 


TAGCTGTTAT 


A1AAAAA1\A» 


GCAAGATATT 


GAACGGTTCA 


AAAGTGAATT 


14040 




TTTACGTCAA 


TAAAAGTATT 


TAATCGAGTC 


TCTTCATATA 


TAAAAGTAAA 


TCTTTCTAAG 


14100 




TGTTGATTTA ACGCTTATCA 


JV^*1V kiv^iintiwit 

ACAATCATTT 


TTTATAAACA 


AATATATACT 


CCTAAATTAA 


14160 


20 


CTTTTAAAGC 


AATGAAAATA 


GTGAACATTA 


TAACTGTTGT 


GTAACAGAAT 


GCAATTAGCA 


14220 




TATTACTGTT 


ACACAAATTA 


GTACAGTTTC 


TATGTTTTGA 


CATACATTTG 


ATGAAAATTG 


14280 




TACATAATTT 


ATGTGAAAAA 


ik fv #*%^nv ^ & *m m m 

AATCACAACA 


AACATGCTAC 


AATGACTATG 


AAAACGTTAA 


14340 


25 


CATAGCATTT 


CAAATTCACA 


jv f+ jv ht* n *hjv ^ k 
ACATTATACA 


GATGGAGGCG 


TTTAGTATGT 


TAGAAACAAA 


14400 




TaAAAATCAT 


GCAACAGCTT 




TAAAAATGGA 


AGATGGAACA 


GACACGTAGA 


14460 


30 


TGTAAGAGAG 


TTTATCCAAT 




TCTTTATGAA 


GGTAATGATT 


CATTTTTAGC 


14520 


AGGACCAACA 


GAAGCAACTT 


V_ X nnftU IX 1U 


GGAACAAGTA ATGCAGTTAT 


CGAAAGAAGA 


14580 




ACGTGAACGT 


GGCGGCATGT 




CACGAAAGTA 


GCTTCAACAA 


TCACATCTCA 


14640 


35 


TGATGCTGGT 


TATTTAGACA 


AAGATTTAGA 


AACAATTGTA 


GGTGTACAAA 


CTGAAAAGCC 


14700 




ATTCAAACGT 


TCAATGCAAC 


CATTCGGTGG 


TATTCGTATG GCGAAAg CAG 


CTTGTGAAGC 


14760 




TTACGGTTAC GAATTAGACG 


AAGAAACTGA 


AAAAATCTTT 


ACAGATTATC 


GTAAAACACA 


14820 


40 


TAACCAAGGT 


GTATTCGATG 


CAT ATT CTAG 


AGAAATGTTG 


AACTGCCGTA 


AAGCAGGTGT 


14880 




AATCACTGGT 


TTACCTGATG 


CATACGGACG 


TGGACGTATT 


ATCGGTGACT 


ATCGTCGTGT 


1494 0 




AG CTTTATAT 


GGTGTAGATT 


TCTTAATGGA 


AGAAAAAATG 


CACGACTTCA 


ACACGATGTC 


15000 


45 


TACAGAAATG 


TCAGAAGATG 


TAATTCGTTT 


ACGTGaAGAA 


TTATCAGAAC 


AATATCGTGC 


15060 




ATTAAAAGAA 


TTAAAAGAAC 


TTGGACAAAA 


ATATGGTTTC 


GATTTAAGCC 


GTCCAGCAGA 


15120 


SO 


AAACTTCAAA 


GAAGCAGTTC 


AATGGTTATA 


CTTAGCATAC 


CTTGCTGCAA 


TTAAAGAACA 


15180 


AAAOGGTGCA 


GCAATGAGTT 


TAGGTCGTAC 


ATCAACATTC 


TTAGATATCT 


ATGCTGAACG 


15240 




TGACCTTAAA 


GCAGGCGTTA 


TTACTGAAAG 


CGAAGTTCAA 


GAAATTATTG 


ACCACTT CAT 


15300 
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10 



15 



20 



25 



30 



35 



40 



4S 



SO 



AGACCCAACT TGGGTAACTG AATCTATCGG TGGTGTAGGT ATTGACGGAC OTCCACTTOT 15420 

TACGAAAAAC TCATTCCGTT TCTTACACTC ATTAOATAAC TTAGGTCCAG CTCCAGAACC 154 80 

AAACTTAACA GTATTATGGT CAGTACGTTT ACCTGACAAC TTCAAAACAT ACTGTGCAAA 15540 

AATGAGTATT AAAACAAGTT CTATCCAATA TGAAAATGAT GACATTATGC GTGAAAGCTA 15600 

TGGCGATGAC TATGGTATCG CATGTTGTGT ATCAGCGATG ACAATTGGTA AACAAATGCA 15660 

ATTCTTCGGT GCACGTGCGA ACTTAGCTAA AACATTACTT TACGCTATCA ATGGTGGTAA 1572 0 

AGATGAAAAA TCTGGTGCAC AAGTTGGTCC AAACTTCGAA GGTATTAACA GCGAAGTATT 15780 

AGAATATGAC GAAgTATTCA AGAAATTTGA TCAAATGATG GATTGGCTAG CAGGTGTTTA 15840 

CATTAACTCA TTAAATGTTA TTCACTACAT GCACGATAAA TACAGCTATG AACGTATTGA 15900 

AATGGCATTA CATGATACAG AAATTGTACG TACAATGGCA ACAGGTATCG CTGGTTTATC 15960 

AGTAGCAGCT GACTCATTAT CTGCAATTAA ATATGCACAA GTTAAACCAA TTCGTAACGA 16020 

AGAAGGTCTT GTAGTAGACT TTGAAATCGA AGGCGACTTC CCTAAATACG GTAACAATGA 16080 

CGACCGTGTA GATGATATTG CAGTTGATTT AGTAGAACGC TTCATGACTA AATTACGTAG 16140 

TCATAAAACA TATCGTGATT CAGAACATAC AATGAGTGTA TTAACAATTA CTTCAAACGT 16200 

TGTATACGGT AAGAAAACTG GTAACACACC AGACGGACGT AAAGCTGGCG AACCATTTGC 16260 

TCCAGGTGCA AACCCAATGC ATGGCCGTGA CCAAAAAGGT GCATTATCTT CATTAAGTTC 16320 

TGTAGCTAAG ATCCCTTACG ATTGCTGTAA AGATGGTATT TCAAATACAT TCAGTATCGT 16380 

ACCAAAATCA TTAGGTAAAG AACCAGAAGA TCAAAACCGT AACTTAACTA GTATGTTAGA 16440 

TGGTTACGCA ATGCAATGTG GTCACCACTT AAATATTAAC GTATTTAACC GTGAAACATT 16500 

AATAGATGCA ATGGAACATC CAGAAGAATA TCCACAGTTA ACAATCCGTG TATCTGGTTA 16560 

CGC16TTAAC TTCATTAAAT TAACACGTGA ACAACAATTA GATGTAATTT CTCGTACATT 16620 

CCATGAAAGT ATGTAACAAA ATTTAAGGTG GGAGCACTAT GCTTAAGGGA CACTTACATT 16680 

CTGTCGAAAG TTTAGGTACT GTCGATGGAC CGGGATTAAG ATATATATTA TTTACACAAG 16740 

GATGCTTACT TAGATGCTTG TATTGCCACA ATCCAGATAC TTGGAAAATT AGTGAGCCAT 16800 

CAAGAGAAGT CACAGTTGAT GAAATGGTGA ATGAAATATT ACCATACAAA CCATACTTTG 16860 

ATGCATCGGG TGGCGGTGTA ACAGTCAGTG GTGGCGAACC ATTGTTACAA ATGCCATTCT 16920 

TAGAAAAATT ATTTGCAGAA TTAAAAGAAA ATGGTGTGCA CACTTGCTTA GACAGATCGG 16980 

CTGGATGTGC TAATGATACA AAAGCATTTC AAAGGCATTT TGAAGAATTA CAAAAACATA 17040 

CAGACTTGAT ATTATTAGAT ATAAAACATA TTGATAATGA CAAAGATATT AGATTGACAG 17100 
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10 



15 



20 



25 



30 



35 



45 



SO 



TATGQATTCG ACATGTCCTT GTGCCTGGTT ATTCTGATGA TAAAGACGAT TTAATTAAAC 17220 

TAGGGGAATT TATTAATTCT CTTGATAACG TCGAAAAGTT TGAAATTCTG CCATATCATC 17280 

AGTTAGGTGT TCATAAGTGG AAAACATTGG GCATTGCATA TGAATTAGAA GATGTCGAAG 17340 

CGCCCGATGA TGAAGCTGTT AAAGCAGCCT ACCGTTATGT TAACTTCAAA GGGAAAATTC 17400 

CCGTTGAATT ATAAATACAA TTCAGACCGA AAAGAAAGCA TATGCAACTT CAAGAGTGAA 17460 

GGGGCATATG CTTCTTTTTC AATTGAGTAT TGAGTATTAG CAAGACOTAG TAAGTATATG 17520 

AGACAACTTC TACAATGGTT GAAGGAAGAC GTTTTTGTAA GTAGCTATGC TGATAAAGAA 17580 

TGTGATGTCT TGTTAAAGGT GGGGTTCCAA TATCATCATT TAGCTGATGT TGAATGGGTT 17640 

ATTATTTGCT ACTTGCATAT GAATATGAGT CTTTTCAAAT TTTTATTGAC CCTGAGTAAT 17700 

GAAAAATATT AAGATGAAAC TTAATATTAA AgCAATGCGG AGCGTGATTA TGAAGAGAAT 17760 

TAGTAAAGAT ATATGGGCAG TATTTAAATT ACTGTATCaA AATAAAGGGC GTTTTAGCAT 17820 

TAATGCCTTA CTATTGCAGT TAATCATGAT TTTT ATTAGT AGTACATACT TAATTTTACT 17880 

ATTTAATATG ATGTTAAAAG TAGCTGGcAA AGCCAACTTA CGATTAACAA TTGGACGGAA 17940 

ATCGTTAGTC ATCCCGCCAG TGTGATACTT CTTATTATAT TCATATTAAG TGTTGCCTTT 18000 

CTGATTTATG TAGAGTTTTC ATTGTTAGTT TATATGGTTT ATGCCGGCTT TGATCGACAG 18060 

ATTATTACAT TTAAATCCAT TTTTAAAAAT GCCTTTGTAA ATGTGCGTAA ACTCATAGGT 18120 

GTACCAGTTA TTTTCTTTGT CATTTATTTA ATGTTAATGA TACCCATTGC CAACCTAGGA 18180 

CTAAGTTCAG TATTAACAAA AAATATTTAC ATACCTAAAT TTTTAACGGA AGAACTTATG 18240 

AAAACGACGA AAGGTATAAT CATTTACGGT . ACCTTTATGA TTGCTGTATT TATATTAAAT 18300 

TTTAAATTAA TATTTACTCT ACCGTTAACG ATTTTAAACC GCCAGTCGTT ATTtAAAAAT 18360 

ATGAGACTAA GTTGGCAAAT TACGAAGCGA AATAAGTTTC GGCTTGTTAT AGAAATAGTT 18420 

ATATTAGAAC TCATCATTGG TGCGATTTTA ACATTAATTA TTTCAGGAGC AACATATCTT 18480 

GCTATTTGTG TAGATGAAGA AGGAGATAAG TTTTTAGTCT CATCAATTTT ATTTGTTGTA 18540 

TTGAAAAGCG CATTGTTCTT CTATTATkTA TTtACGAAAT TATCATTAAT CAGTGTGTTA 18600 

GTACTGCACT TAA 18613 
(2) INFORMATION FOR SEQ ID NO: 113: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1214 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 113: 



10 



15 



20 



25 



30 



35 



AAAGTTTTAA 


AAGGGGTGAG 


ATACTTGGCG 


AATAATCCAT 


TCCAGCTTTG 


CGTTTAAAAG 


60 


GAATTATACT 


TGCCATTGTC 


GGTGCTTGTT 


TATGGGGATT 


AGGTGGTACT 


GTTTCTGATT 


120 


TCTTGTTCAA 


ATATAAOAAT 


ATTAATGTCG 


ATTGGTACGT 


CACTGCTCGA 


CTTGTAGTCA 


180 


GTGGTGTTTT 


CTTACTTATT 


ATGTACAAAA 


TGATGCAACC 


CAAACGTTCA 


ATATTTAGCG 


240 


TATTCCAAGA 


TCGACGTATG 


TTAGGCAAAT 


TACTTATCTT 


CAGTATACTG 


GGCATGTTAG 


300 


TAGTACAATA 


TGCTTATATG 


GCATCTATTA 


ATACAGGTAA 


TGCTGCGATT 


G CAACATT AC 


360 


TACAATACAT 


TGCGCCAGTT 


TATATTATTA 


TTTGGTTTGT 


CATAAGAGGC 


GTTGCAAAAC 


420 


TAACATTATT 


TGATGTGCTT 


GCTATTATCA 


TGACACTATT 


AGGAACATTT 


TTATTATTAA 


480 


CAAATGGTTC 


ATTTTCTAAT 


TTAGTCGTCA 


ATCCTGCAAG 


TTTATTCTGG 


GGTATTTTAG 


540 


CTGGTGTAGC 


ACTCGCTTTT 


TACACAATTT 


ATCCTTCAGA 


CCTACTTAAC 


CGCTTCGGTT 


600 


CGATTCTAAT 


TGTCGGGTGG 


GCAATGCTTA 


TTTCTGGTGT 


TGCGATGAAT 


TTACGCCATC 


660 


CAATTTGGCA 


CATTGATATC 


ACTAAATGGG 


ACATATCAAT 


TATATTATTT 


TTAATCTTTG 


720 


GTATTATCGG 


TGGTACCGCA 


CTCGCATTTT 


ATTT CTTTAT 


CGACAGTTTA 


CAATACATAT 


780 


CAGCGAAAGA 


AACAACATTA 


TTCGGAACTG 


TTGAACCTGT 


CGTAGCCGTT 


AT CG CAAGCA 


840 


GTCTATGGTT 


ACATGTGGCA 


TTCAAACCAT 


TTCAAATCGT 


AGGCATCATT 


CTTATTATGA 


900 


TTTTAATTTT 


ATTACTATCA 


CTTAAAAGAC 


AACCTGAAAC 


ATTAGATGAA 


TAAGAAAACT 


960 


CTGATAATCA 


CTTTAGCAAG 


TAACTATTAT 


TTAACAACGT 


AGTTACCTTA 


TAGGTGATAT 


1020 


CAGAGTTTTT 


TATTTTAGTT 


AATAATATTT 


TTCACTTGGT 


ATAAAAAaGC 


GTCGTCGCTC 


1030 


TGGTAATCGG 


AAATACTGGA 


ATAAAATATG 


GAATTGGGTA 


ATAATCCCAG 


GTAnTAAAAG 


1140 


TCCAXGTTCC 


GATAnCCTnT 


CCGCAnCTCC 


AACCAAATTT 


GCCGATAAGG 


TTCCAAAAGG 


1200 


CATCCTGGGG 


GTAC 










1214 



40 

(2) INFORMATION FOR SEQ ID NO: 114: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9456 base pairs 
4$ (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

60 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 114: 

ATTTTGGTTT CATTCACGAT GGGGTnATAC AGCAAACACA nCTAAAATAA CTATCAATAG 60 
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CTTAGACAAT AAAAAATATG CCACTACAAT CGCTAATATT ACQATTAAAA AAGAAGCGTT 180 

AACGATTACT TTCATCGTTG TTCTATCTCT GAACATCATA TTAAAGACAA CTAGACTAAT 240 

5 TGATAATGAA ACAGCAAAAA AAGTAATAGC TAACACTAAT TTCATCATAA ATAGACAGAC 300 

TAAACCTATO ACTAATAATG TATTAOAAAT TACAGCTGAC GTTTTTAACA TTCTCGaATT 360 

AATATGCACT CACCCTTTTT ATTTAAATAA CTTACATAAT CATAATAATA CATGATGTTT 420 

10 

CATAGGCCTG TCGATGATTG ATTCACAATA GCACGTGATT TTTTTGTTTT TCAATATTAT 480 

TCATTTATTC CATCAAAAAC ACCCTTTTTA ATTTTTACAA AAATTAAAAA AAGTGCTCCT 540 

1S ACACTGCTTG CATGTAGAAA CACTTTTTCA TTGTAATGTT ATTCTTCTCG AGACATACCT 600 

TTTAGCATAT TAAGCATGTA TGTTAAACTA CGGTTCATGT OGTCATCTTT CAATACGCCC 660 

AATAGACTTC TTATAGTTGT CTTAGCATTT GGACTCGCTT GATTGGCAAC GTGTAATCCT 720 

20 TTATTAACTT TATTTAGGAA GTCGCTTAAA TCTGATACAT TGAGTTCACC TAATAAAAAT 780 

ACCATTQAAG CCATATTAGA TAATAGCCCT GTATAAATAT CTTTATTAAG TTCAACTGCA 84 0 

AATTTATTTA TGATGACTTG ACGTCCTCGA ATTGCACCAT TTAAAGCATC TAATAGTTTT 900 

25 GCATCATCTA ATGTTTTAAT AAGCTTGATT GCTTTTAATA TACTATCTTT ATTCGCTGCA 960 

ATTGCCTCTG TAACTTCATT TAAACTTTCT AACTTAATTT GTTCTTCTGA TTTTTCTAAG 1020 

CGTCTAATTT TAGAAGATAT TCTCTCAGCC ATTATTTATC CACCTGATTT CCCGGGAAAA 1080 

30 

CATAATCTGA ACGTTCCCAT TTTTTCTGTA CTTGAACACT GTACTGCGGT TGACGTTTTT 1140 

TATTGACACG GAAATTATTA GGGTTCAACG GTGACTTACC ACGTTTCGTA ATTACCTCCA 1200 

AACGACAGCT AGTACGTTTA TAAGATGGTG TATCCGTGTA TTGATCAACA TCACTaTTAG 1260 

35 

TTAATAAGTT AATTGCACCT AGATCTCCAT TTTGCATCGC aTCaTTATTT AATGGAAT AT 1320 

AGATTTCTTT ACCTTTAACA CGATCTGTCA CGTGAACTTG TAATACCGCT TCTCCTGTyT 1380 

4Q CAGAAATCAG CTTAACTTCT GCACCTTCAT GAATGCCTCT ATCTTCAGCA AGCTCTGGAG 1440 

AAATTTCAAC AAATGCACGT GGCACTTTGT ATTTAATCAT TGGTGTTTGA TAAGTCATAT 1500 

TACCTTCATG GAAGTGCTCT AACAATCGAC CATTGTTTAC ATGAATATCA TAAATTTCAT 1560 

45 CTTGCTTAAA GTAATTATCA AATGATAATG GGAATAATTT TGCTTTACCA TTATCAAAAT 1620 

TGAATCCTTC TAAGTATAGA ATAGGCTCAT CAGTACCATC AGGTTGTACT GGCCATTGTA 1680 

AACTATTGAA TCCTTCTAAA CGATCATAAC TTACCCGAGC ATATAGAGGT GTTAAGCGTG 1740 

50 _ 

CTACTTCATC CATAATTTCA CTAGGATGCT TGTAATTCCA ATCAAATCCT AATCTATTAG 1800 

CAATTGCTTG GAAAATTTTC CAGTCAGGTT TTkAATCACC AAGAGGTTCT AATGCTTGGT 1860 
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s 



10 



15 



35 



40 



TTGCTGGCAA 


TACAACATCT 


GCGTATGTTG 


CTGTGAATGT 


TAAAAATTCA 


TCTTGGACTA 


1980 


CCATGAAATC 


TAATTTTTCA 


AACGCAGCTT 


GTACAAAATT 


AATATTTGAA 


TCCACAATAC 


2040 


CCGTATCTTC 


ACCATATAAG 


TACAATGAGT 


GTACTTCTCC 


GTCATGTATA 


CCTTCTACCA 


2100 


TTTCATGATT 


ATCTTTACCA 


GCTTTTGGAT 


TCAATTTAAC 


GCCATATTCT 


TTTTCAAATT 


2160 


TAGCGCGAAT 


ATCATCCGCT 


TCAATACTTT 


GATAACCAGT 


AATCTTATCA 


GGCATACTTC 


2220 


CCATATCACT 


ACATCCTTGA 


ACATTATTAT 


GTCCACGTAA 


TGGATACGCA 


CCAGTACCAG 


2280 


GACGACGATA 


ATTACCTGTT 


ACTAATAATA 


AGTTTGAAAT 


CGCTGTACTT 


GAGTCACTAC 


2340 


CAATGTCTTG 


TTGTGTAATA 


CCCATTGCCC 


AACAAATTAC 


AACAGATTCA 


GCTTTAGCAC 


2400 


ATTCTTCAGC 


AAATTTAATC 


AATTCTGATT 


CAGGAATACC 


TGTTGCTTCT 


TCAGCAAAAG 


2460 


CCATTGTAAA 


TGTTTCTAAT 


GATTTGTAAT 


ATTCATCAAA 


ATCATCTACC 


CACTCATCAA 


2520 


TAAATGCTTT 


ATCGTGTAAA 


TCATGATCAA 


TAATATACTT 


AGTCACTGCA 


CTTAACCACG 


2580 


CTAAATCCGT 


ACCTGGTTTA 


GGTTGATAAA 


AACGATCCGC 


ACGTTCTGCC 


ATTTCATGTT 


2640 


TTCTAATATC 


AAATACATGT 


ATTTTTTGAC 


CAAATAATTT 


TTGTGCACGT 


TTCATGCGTG 


2700 


ATGCGATAAC 


TGGATGAGCT 


TCGGCTGTAT 


TAGTACCTAT 


CAATACAGAC 


ATTGCCGCTT 


2760 


TTTCTAAATC 


TTCAATACTA 


CCTGAGTCAC 


CGCCGTGTCC 


AACCGTTCTA 


AATAAG CCTT 


2820 


TTGTTGCAGG 


TGCTTGGCAA 


TATCTTGAAC 


AGTTATCAAC 


GTTATTTGTG 


CCAATAACTT 


2860 


GTCTTGCTAA 


TTTTTGCATT 


AAATACGATT 


CTTCATTCGT 


CGCTTTAGAA 


GAAGAAATGA 


2940 


ATGATAGTGC 


ATCTGGGCCA 


TGCTTTTCTT 


TAATAGCTGT 


AAAATTATCT 


GCAATGACGT 


3000 


TTAAAGCTTC 


ATCCCATTC'T 


ACTTCATGGA 


ACTCACCATT 


TTTCCTTACT 


AGTGGTTTAG 


3060 


TTAATCGTTG 


ATCTGAATTA 


ATATGTCCCC 


ATGAAAACTT 


ACCTTTAACA 


CAAGTCGCAA 


3120 


TTTTATTTGC 


TGGAGAATCA 


TGTGATGGTT 


GTACTTTTAA 


AATTTCTCTA 


TCTTTAGTCC 


3180 


AAACTTCAAA 


TGAACAACCC 


ACACCACAAT 


AAGTACACAC 


TGTTTTAGTT 


TTCTTAATAC 


3240 


GCTCTTTACG 


CATTTCTGCT 


TCTGAATCTG 


AGATTGCAAA 


TAGTGGACCA 


TAACCAGGTT 


3300 



CTGCTTTTTT AGTTAAATCA ATCATTGCTG CTAATGAACC AGGTTCCGTA TCAGTCATAT 3360 

45 AACCCGCATT ACCTTCCATA TTCACTTCCA TCATGGCATT ACATGGACAT ACCGTCGCAC 3420 

ATTGACCACA AGATACACAT GAAGACTCAT TAATCGGTAC ATCATTATCC CAAATAACAC 34 80 

GTGGATGTTC ACGATCCCAA TCAATTCTAA TAGTTTCATT CACTTCGATA TCTTGACATG 354 0 

60 CTTCTACACA ACGCCCACAT AAGATACATT GATTTGGATC ATAACGATAA AATGGGCCGT 3600 

AATCTTTTTC GTATGGCTTC TCTTTATATT CATACGTTTG ATGCTGAAGC CCCCATGCAT 3660 
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TATGCTTTTC TAAAATTCGA TCAAGCGCTT CTTTTTGAGC ATCTTTCACA TCATTGTTCA 3780 

CAGTATTTAC AGTGATTGGA CGATCAATCA CCGTACTACA TGAACGTTCA ATTTTACCGT 3840 

CAATCTCAAC AGTACATGTA TCACATGTTT GAATTGGTCC CATCGACTCG TTATAACAAA 3900 

TTGAAGGTAC AAAAGTATCT TGTGATTTAA TAAATTCAAG TAAATTCGTA CCTGGTTCTA 3960 

CAAGATAATC TTTTCCATCA AGTGTAACCA CCAAATGTTC TTGCATATTA CTCACCCCGT 4020 

CTATATATAT TTTCCGTAAA TGACTTTTAA TAAATTGCTC ATATCCACCT AAAATAACGA 4080 

TGCCCCACAC ATCTTTCAGA TAGAATTAAT TTAATTGTAT TACTTTATGT ACTAGTTGTT 4140 

AAGTAAAATT TTGTATTTTG CCTTTTTACA ATCATTTTTA TTTGAAATAT TTTGOGCOAA 4200 

ATTAAATCAT CTTTTTGTTT AATTGAAAAT AATTATCATT ATTAGTTTTC CAATTATCTG 4260 

TTTCACGCTT TTTGCCATAT CTTTCACAAC CTTATTAATG ACAATATTTA ATAATCACCT 4320 

20 CACCTAAAAA TCGTTATACT ATTTATAAAT ACCCTTTTTC TGAAAATTAA TAACCCAAGT 4380 

TTGATAAATA TCTACTATCA TTTAGAAGGT AATATTTATC TTTAAATTAA ATTTGTAATG 4440 

GATTAATTTA TAAAAATCAA ATCAGGCATT AAATAAAATA GCCCATAAAT ACAAAGTGTT 4500 

25 ATCACCTTCT ATTTACGGGC. TATTAGTTCT ATTCGTTATT CTATTTACAG ATCATTCTAT 4560 

CTAATTAATT TGTGTACAAT TTTGATAACT TATTTTCCCT TAGTTTACTA CTCTAGATTA 4620 

TCTTTTAATA ACTTAGTACT TTCAGCTTTT GACTGCTCAC TAGGAATGAA GTAGTACAAT 4680 

COGTCACTTT GAATGCCGCC TTGACCACTC AATTGATGTT TATTAATCGT GTCATTAGCA 4740 

TCTTTATAAT TGCTTCTAAT CGTATTCAAA TCACCTAATG TTAAATCTGT TTTAACATTA 4800 

TTTTGAATTT CATTCATTAG ACTATTAAAA TGTGTAATCG ATGATGGGCT TGCAATCTTA 4860 

TTGGCCATCG CTTCAAGCAC AATTTGCTGA CGTTGTTGTC GACCAAAGTC ACCACGAGCA 4920 

CCTTCTTCTT TACGACTTCT AATAAACTTC AATGCTTGAT CACCATTTAC ATGTGTCTGC 4980 

40 TGTCCTTTTG TAAAACGAAC ACCATCAACA GTGAATGTAT CATTACTTAC TACATCAACA 5040 

CCGCCGATGC TATCTATCAT ATTATGCAAA CCATCCATAT CGATTGTCGC ATAATGATCA 5100 

ATTGGCACAT TCATTAATTT TTCAAGTGAT TTAACAGCCA TATTTGGTCC ACCATATGCA 5160 

45 TAGGCATGTG CAATTTTTTC AGTAGTACCA CGGCCAACAA TTTCCGCTCT TGTATCACGC 5220 

GGTATACTTA CTATTTCAGT TTTCTTCGTT TTAGGGTTGA TAGATAAAAT CATAATACTA 5280 

tCACTACGCT CTCCGCCACC CTTTTTCTTA CGATCAGCAT CTGAATCGAC ACCAAATAAA 5340 

SO 

GCGATTGTGA ATGGATCACC ATCGTTTAAA CTCACTTTTT TATCTCTTAA TTCTGAATGA 5400 

TTGCGATCTA ACGGATTGTG TATCTTATTA CCAGTAATAA AAATTTTAGC AGCTACATAC 5460 
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GGTAGGCTCA TTTTACTTTT AGACOAACGT 
ACATACTTTG TCTGTTTTCT CTATTTATTA 
5 TGTAGACGTA TAACTATTTT TTATCATTTT 

TGATAACCAC CATTTGCATT TAAAATTTTA 
ATAATAAAAG GTGCACCCTT TAAATGATCA 

10 

AGATTCAATA GTTCTGCAAA TAAAAACTGT 
TTAATATGTG CCCCAAATTG ACCTTTTGCC 
ACTAAACGAT AACTAAATGA GGCGTCAAAT 

1$ 

TGTGCATTAA ACGATATAAT AGCGTCTTCC 
ATTCCATTAC AAAAAGCACC TTCTCCTCGT 

2Q TCATATACGT ACGATAACAT TGGTTTACCT 

TCTTCTTGCT GTTTTACTAA ATTGGCAGTT 
TTAATTTCAT TCGT AAT CAT TTCATTACTT 

25 AAATGTGTTG CTAAAAATTG TTGGAATTGT 

AAATCAAATC GATGACG CTT AGTTTCTGTA 
TTGTCTATTT GTTTCAACCA CGAACATATT 

30 GTCATTTCGT CCACCACTTC T CAT AT CATT 

ATCAACAATA CAACTGAAGA CTT CTT CATT 
CTAGCCGACA AATAGAAAGG AAAGTAAGTA 

35 

GAACGATTAA AAGCTATCTG TTATATAGCT 
ACAAGTAATA TCATAGCACA ATCTTTTTTA 
GATTTTTTTA AAAAGATATT GAAAATGTCC 

40 

AATATATCAT CTTTTAGGAG GTGGCTGTCA 
TTACTGCAAT TCAACAAAAT AAAAAAATGA 

45 TATCCAAACG CACAATTTTA AGAGATATTG 

ATGCGCATTA TGGGAAAAAT GGTGGTTACC 
TAAACTTATC TGAAACACAA TTATCAG CCT 

SO ACTCGACATT ACCATATAAA. AGCGAAATCA 

CACAAACACG CTTAAGAAAA TTG CTTAAAC 

55 



TTCAATCCCA CCACTCCTTT ACTATTCCTT 5580 

TATAGTAAAA TAATTTTTTT ACTATACTTC 5640 

TTATCTCTAG AGAATATCTA TCTGTATTTT 5700 

AGTACCGTTT CATGACATGC TTTATTACTT 5760 

ATTGCCTTAC CATCTAAAGT CGTCATTTTT 5820 

GCAGCAATGT CCCAAGGTTT AGGATTTGTA 58 80 

ACTCGCATAG AATCTAATCC GCAAGCACCA 5940 

AAATCTTGCA CCGTATCTAG ATTCATCACT 6000 

AATTTTAACG ATGGTGGTTC TTC CATCTTA 6060 

ATTGCTTTAT AAAGCTTTTT ATGCGGATAA 6120 

TCATAAAAAT ACGCCAATAT AATACAATAA 6180 

CCATCAATGG GATCCATAAT CCATAAATGA 6240 

TTTTCTTCCG CTAATAGTTG GTGTTCCGGA 63 00 

TGTTGAATCT GTTTATCTAC ATTTGTAACT 63 60 

GTCATTTCCA TAATTAATTG CGGAATAACA 6420 

AACTTATCTA TTTGCTGTAA TGTTTTATCT 64 80 

ATCATTTTAT TATTACCCTA TATTAAAAGA 6540 

TTATG CAT AA AAAAATCGGC TAGTCACGTG 6600 

ATAAATATTG AAGATGTTGT GATGTAACTT 66 60 

CTACCCCTTT GTTTAATCGC TCCCCCTGTT 6720 

AAATGTAAGC GTTTTCCACA AAATTTTTAC 67 80 

TCATTGTCAC TCTTATGTTA TACTTTGTGT 6 840 

TGAATAAAGC TGAAAGGCAA AATTTAATAA 6 900 

CCGCTTTAGA ATTAGCTAAA TATTGCAACG 6960 

ATGATTTAGA AAATCAAGGT GTTAAAATTT 7020 

AAATACAACA AGCACAATCT AAAATTGCAT 7080 

TATTTTTAGT GCTTAATGAA AGTCAGTCGT 7140 

ACGCAATTAT AAAACAATGT TTAAGTCTTC 72 00 

GCATGGACTT TTATATTAAA TTTGATGACA 7260 
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ATGTGATGTT AGTAGATCAT AOGOTTGATG ATAAXATTAA AGCTGAAAAC GTTATATTTA 7380 





TTGGCCTTTT 


GTGT AJV A OAT 


<V2 A ^!AT , TV3f^^ , 


ATGCAGTCAT 


TTATGACATT 








AAACTGCCGA 


Al^TO("iA A ATT 


nA A A AT ATT A 
VxnMnftX nX in 


TAGATATTTC 


GTATTCATTC 


ftTSTAAfiArVSA 


/5U0 




TTPAAACPAfi 


Af2Ar , ATATrV t 


ATTY2 ATA hPT 
Al XViAxAAv*x 


ATCATCAATT 


TTTAAACCCC 


& ^^^^^^ A Tf*^P^^^^^P 
AX VJVjA 1 l\.l_ 1 


7560 


10 


AAAAAArrAGT* 


AfSTA AfSATTCA 
avj x#wm/% x \sa 


111 lUinl In 


GAAAATATCT TGCTGCTGTT 


U X\m 1A1 1 1 Al 


7620 


nUvi Xnl* X 1L 


wlni xTjAAxV? 


GnTTCGCTTT 


CCTAGGGTGC 


CGTCTCAGCC 


TTGGTCTTCG 


7680 




AV- 1 AtfViWtL. X VJ 


CTCCCTCAGG 


AGTCTCGCCA 


TTAATAft^TAf? 
a +.m-w\ inv xnw 


GTATTAACAT 


GTAATTTTAC 


7740 


1S 


TTTGAAATAC 


TTAAAAAAAT 


AAAACACTTT 


^3f*^*^* A ft PT*P & 
V9\»V»^»nSVk> X in 


u\u x riuv^nni 


AGAAACTGCT 


7800 




GTTAGAATTC 


CTCAAAATGA 


TATTTCGCGA 


liilvi Innlv 


Ann X X \» X X AA 


AAAGATAGCT 


7860 




GATAGCGAAT 


TCGATGAATT 


CAGACATCAT 


CGTGGCGCAA 


A ^P^^^*^P A ^P^*7V 


TCTAAAAATG 


7920 


20 


ATGTTAAAAA 


TCACCTCATA 


TTCATATACT 




TTTCTGGCCG 


TAGAATAGAA 


7980 




AAATTACTTC 


ATAACAGTAT 


TCGAATGATG 


TGGTTAGCTC 


AAviAxtJAAAC 


ACCTTCTTAT 


8040 




AAAACTATTA 


ATCTTTTTAG 


AGTGAATCCT 


ft ft rrift /wu>* ft >iy t 


CGCTAATTGA 


ATCTTTATTT 


8100 


25 


ATTCAGTTTC 


ATAATAAAAT 


GCATATCAAA 


AAAGCTGATT ■ 


- X 1A1 LAAA1 


AATTAATAGA 


8160 




AATCAGCTTT 


TTTCaTTGCC 


TAAAAACTTA 


A X vj 1\, L. LviAv 


CTCTTTATCT 


ACGCATAAAT 


8220 




ACTTATTACT 


GATATAACGA 


AAGAAACAAA 


AX XnX X X Vjv~ X 


ATATY2TA ATV2 


CAATTGTTGA 


8280 


30 


ACCTAGGTTT 


CTTCCAGATT 


TTAAATAAGT 


GAAAACTAAT 


ATGATGGATA 


GTATGAGATA 


8340 




TGGACCAAAC 


TCAAACGGCG 


ACTTTGCATC 


AGTCACATGA 


ATAAATGCAA 


ATAAGAACAC 


8400 


35 


CGAAACAATA 


CTCATAGCTA 


TAAAATTAAA 


CTTCTTACCT 


AATTCTCCAA 


TTAAAATATG 


8460 


TCTAAATACG 


ATTTCTTCAA 


CTATTGGACC 


TACAATCACA 


ATTAATAAGA 


ATGCTACAGG 


8520 




TAAAAATGCA GGCACTTCAA ACATTTTATT 


TAGCTCAAGT 


TCATTGGCTG 


XT t CACTAT A 


8580 


40 


TTGCAAATGT 


TTAGGTAGAA 


ACTGTGTCAT 


ATATTCATAT 


GTATAAATTA 


ft n ft ^n/**ft ft 

AGATGAGAGC 


8640 




AATAATATAC 


GTTATTGACA 


ATCTAAGCCA 


ATATTTTTTG 


ATATACGCAA 


AAUCACjCT cg 


8700 




AAGCCTTGAT 


GGCATCACTT 


TTAAATGAAA 


TAAATAAAAT 


GCGCCAATCC 


CAATCGTATA 


8760 


45 


TGCTAAAGCT 


TGTGTGATAG 


TCGCTACAAA 


TATCAGATTA 


CTATCGATTT 


CATAATAACC 


8820 




AAACAAAATT 


GGTCCTATGT 


AAGCTGCAAT 


TGTGAGTGCA 


TAAAATATAA 


CACCTATAAT 


8880 




TGGAATTATA 


AGCAAATCTC 


TCCATGCTAT 


ATCTTTAAAC 


GTGTATTTCT 


TTTTTTCATT 


8940 


50 


TTCCaCTGTT 


ATATCCtTTC 


CTGTTTAATA 


ATTGATTTTT 


GGAGGTACTT 


CTACATGATA 


9000 




AACGAAACTA 


AGTATATGAG 


ACAACAAATT 


ACTAATTTGA 


TTCAAATCAT 


TGATACGATT 


9060 
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ATAGTTACTA ATGAATTGAA TAAGTTCAAA GGCTTTGAAA CATCATATAT AATAAACGAA 9180 

AATCAAGTTT CCTATTATOA AATTATAACA CTACTTAATA AACOTCCCCT CgACAAGTCG 9240 

5 ACTATOGTAA CAAAATTCAA TATCTTAATT TTTATCATAC AGAACTATCT AACGCATTAT 9300 

TTGCAATTAA ATTTGCCCAT TAACCTATTT TTCATAAAAT GTCATTTAAA CAAGTTATTT 9360 

ATTAAAATTC ACTTTATTAC ATAAATTATA CAATTArAAA GTTTCTTCAA ATTGTAAAGA 9420 

w 

TGCATTAATC GAGTTATAAT CATAATGATT AAGATGGT 94 58 
(2) INFORMATION FOR SEQ ID NOi 115: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 910 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 115: 



25 



30 



35 



40 



45 



AnGCGTATCA 


TGTCACGCAT 


TTTAACTACT 


TCTTTACCAC 


AAGATTATAC 


AGTCACATTA 


60 


GTTGATCGTA 


TGCCATTTCA 


TGGATTGAAA 


CCAGAATTTT 


ATGCTTTAGC 


TGCGGGCACG 


120 


AAATCAGATA 


AAGATGTTCG 


TATGAAATTC 


CCTAATCATC 


CACAAGTGAA 


TACAGTTTAT 


180 


GGTGAAATTA 


ACGACATAGA 


TTTAGATGCT 


CAAATTGTCT 


CAGTCGGTAA 


TTCTAAAATT 


240 


GATTATGATG 


AGCTAATCAT 


TGGTTTAGGA 


TGTGAAGATA 


AATATCATAA 


CGTTCCAGGA 


300 


GCCGAAGAAT 


ATACACATAG 


TATTCAAACA 


CTCTCAAAGG 


CTCGGGATAC 


TTTC CATAGT 


360 


ATTAGTGAAC 


TACCAGAAGG 


TGCTAAAGTC 


GGTATCGTTG 


GTGCTGGATT 


AAGCGGCATA 


420 


GAACTTGCCA 


GCGAATTAAG 


AGAAAGTAGA 


TCAGACTTGG 


AAATATATCT 


TTATGACCGT 


480 


GGGCCGCGAA 


TTTTAAGAAA 


TTTTCCAGAA 


AAATTAAGTA 


AGTATGTTGC 


GAAATGGTTC 


540 


GCCAAAAATA 


ATGTTACCGT 


TGTTCCAAAT 


TCAAATATTA 


ATAAAGTTGA 


AC CTGGT AAA 


600 


ATATATAACT 


GTGATGAACC 


TAAAGATATT 


GATTTAGTTG 


TATGGACAGC 


AGGAATTCAA 


660 


CCTGTTGAAG 


TTGTTCGTAA 


CTTGCCGATT 


GATATAAATA 


GTAATGGACG 


CGTGATAGTT 


720 


AACCAGTATC 


ATCAAGTACC 


AACATATCGT 


AACGTCTATG 


TAGTTGGTGA 


TTGTGCTGAT 


780 


TTACCACATG 


CGCCAAGTGC 


TCAGTTAGCC 


GAAGTTCAAG 


GTGATCAAAT 


TGCCGATGTG 


840 


CTTAAAAAGC 


AATGGCTAAA 


TGAACCATTA 


CCTGACAAAA 


TGCCGGAACT 


AAAGGTACAA 


900 



50 

GGTATCGTTG 910 
(2) INFORMATION FOR SEQ ID NO: 116: 
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(A) LENGTH: 10182 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 





(xi) 


SEQUENCE DESCRIPTION: 


SEQ ID NO: 


116 : 






10 


TTTTTGATTC 


AAAGTGGTGA 


TTTAACAAGC 


ATTTTAAATA 


GCAATGATTT 


GAAAGTCACA 


60 




CATGATCCTA 


CCACTGATTA 


TTATAATTTA 


TCTGGTAAGT 


TGTCGAACGA 


TAATCCAAAC 


120 




GTTAAACAAT 


TAAAACGTAG 


ATATAATATT 


CCTAAAAACG 


CATCAACAAA 


GGTGGAATTA 


180 


IS 


AAGGGAAXGA 


GTGATTTAAA 


AGGCAATAAT 


CATCAAG AT C 


AGAAACTTTA 


TTTTTATTTT 


240 




TCAAGTCCTG 


GAAAAGACCA 


AATCATTTAT 


AAAGAAAGCC 


TTACTTATAA 


TAAAATAAGT 


300 


cU 


GAACATTAAT 


ACTTATGCTG 


TAATTATAGA 


AACATCCAAA 


TCATCTATTA 


HAATCCTATA 


360 


TT AT AAAAn C 


ACCTCACATA 


ACTCGTTCAA 


CTGTACCAAA 


CCACATTACA 


TTAGATTTTA 


420 




GGCTAACTAT 


TGTGATGTAC 


ATCAAAAACG 


AATTTGTGAG 


GCGTTGTATA 


TTTTACAAAG 


480 


25 


GTGACTAGCG 


TTTCGTATAG 


CATTTCCAAC 


ATTACTACAC 


TCAAGCGTCA 


CGCTAAAGTT 


540 




CGAAATCGAA 


TCCTTTCATT 


CAACAAAAGC 


TCATATCCAC 


TACAAACTTC 


ATATCAAGCG 


600 




TATAAACTAT 


CTTGTGATAC 


TATCTCGATC 


ATATCTATAG 


TATGCATTTG 


TGTTCOGTTT 


660 


30 


CACTGAAGTA 


TATGTATCAT 


CAGTTAAGTA 


TAAACCGTCA 


TCCTTCAATG 


TTACTTGATA 


720 




AGCATATTTC 


CGTGCTAACC 


AGG CAATATC 


TATATAATTT 


TCTCCTGCGT 


TTTCATAACT 


780 




TCTTAAATCT 


TCAATATGTG 


CACTAACTTC 


AGGGaAAATG 


ATTCTAACAA 


CACTTTCATC 


840 


OS 


AACCCAATAT 


TTGTCATGCA 


TCCATCGCAC 


TTGATCTGCC 


AATAAAGGTA 


ACTGCACATC 


900 




ATTGAAATAT 


AGACGAAAGC 


CGTCACTATC 


ATACATTTGC 


CGATATGGTA 


ATGGCTGTTT 


960 


40 


TCTAATCACT AACACCTCGC 


CACCCATTAC 


GGTGCCTTCT 


CTAGTATCAT 


CACTTCCACC 


1020 


CGAAGCTTCA 


TACGTTGTTG 


GGTCAACCTG 


TAGTCCATGT 


ACATCTCCAA 


TATAAGCATC 


1080 




TGGTTTATGT 


TCCATTGCAT 


GTCCATGTGC 


AATCAATGCT 


AATATTGTAG 


ATTGTGAAAA 


1140 


45 


TTGAGGCTCC 


CATTCAATGC 


GATTAGGATG 


GCTACTATAA 


ATTCTAGGTT 


CATCTATAGC 


.1200 




CTGCTGAATA 


TCCATGCCAA 


ACACTAATAC 


ATTGATTAAT 


GTTTGCGCAA 


CACTAGCAAT 


1260 




GATACTTATG 


GCACCAGGTG 


CACCTACTGT 


TAATATTGGC 


TTCCCGTGAT 


ACATCACAAT 


1320 


SO 


CGTTGGAGCC 


ATGTTACTTA 


GTGGTCGTTT 


ATATGGTGCA 


ATTTCGTTAA 


TACCACCATC 


1380 




TACTACATCA 


AAGCCATCCA 


TTGTCGTATT 


CAATAACACA 


CCGTAGCCTG 


GAATCGTGAT 


1440 




ACCTGAACCA 


TAAATCATAC 


CAATTGATGT 


CGTAAATGAA 


GCAATATTAC 


CTTCCTTATC 


1500 
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ATCAGACACA ACACCATGCT CTATATCAAT 
GCGTGCTTTT AAATAATCAT CATCAATTAA 
6 ATCCGCCAAG TATTGCGCAC GATCACTATA 

CAAGTAATCA ACAGATCTTG GACCCATAGA 
TATTTGAATT ACCGTGATAC CGCCAGAACT 

10 

TTTAAATGTT GCACTGATTG GCGCTTTAAT 
AGTGATTGTC CCACCACATG CTTTGACAAC 

15 ATAAAATGCA TTAAACCCTT GTTCTCTTAA 

TACAATCCAA TCACCTTCAC GCCAATATTG 
ATGATACTTT GTCAATCGTG CGTGTTGCTG 

20 TGCATGACCT TCAATGGCTA GTTCAATTGC 

AG CATAACGC TTGTGAATAT AATCAAACAG 
ACCATGTGTA GTCATATCAA AAAATGATTT 

25 TTTGTCTACA TGTTCAGGTG CTGTCTCACG 

TTGCTCATAA TATAGCAAAT ACCCGCCACC 
ATTCAATGCC AGTTGAATTG CAATCACTGC 

30 

AT C CTTACCA ATTTTAGCCG CAAGAGGATG 
TTTTGTCTGT TTGTCATTTA AGTTAATGAC 

3S ATTTAAAACA TTATTGATTA ATGGCTTTTT 

TACCAGTATC GACAAGTGGT GTAATCGGTG 
ACTfAATAAA TTGATCCTGA TCTATCGCAT 

40 TCTTAAATAT ACCTTTTTTA ATATTTAGCA 

GAATAATGCT TAAATTTTTA TCCGACTTAA 

CCAACATATC AATTGAATGA TTTCTAAGTT 

45 

ACTTCAATGT AATATTTTTA ATTTTAGCTG 

ATCCTGGATT ACGTTGAAAC GTTGCTTGAT 

CACTTGCATA CAGCGCATTT TTCCCATCTG 

50 

ATCCTTTTGG ATATTCTTGA TTTACTTGAT 
AAGAGTGTGT TAAGTAATTT ACCTCTCGAG 

55 



ATTTGCTTTA TTGCTATCAA TGAGCGTACT 1620 

TGACTGTACA GGCACCTCAT GAAAATTATC 1680 

TGCTAAATGC ATCGCTTGTA TCAAATGATG 1740 

TGGTAAATCG ACATGTTCTA ATAACTTCAA 1800 

AGATGGTCCC ATTGaATAAA TGTCATAGTC 1860 

CTGAATGTCA TATTTGGCTA GATCCTCTAA 1920 

ATTGACTAAT TGTTTCGCAA TGTCACCTTT 1980 

TATTTGAAAT GTCTTACCTA ATTCGGGTTG 2040 

ATTTTCATGC GTAAATACTT GTGCCGTTTC 2100 

GCGCGAATAT TTTTCAGTAG CCCAATTGGC 2160 

AGGATTAATT AAATCTTCCA ATGACAATTT 2220 

CTTTGGAATT GCTGGCACAG CGACAGTTTT 2280 

ATATTCGCCT GAATCATCTA GATAAAATTG 2340 

TGCATCAAAC GCAGTTATAC TGCCAGTACT 24 00 

AC CAATACCT GATGCAAATG GTTCTACCAC 2460 

ATCCATGGCG TTGCCACCTT GATCTAATAC 2520 

TGATACGGAA ATTAACCCTT CTTTAGATGT 2580 

CATACTATAT CCTCCTACTT TCTGTTAAAT 2640 

CTACTTTTTC TAAATCTTGA CGTTGCTCGT 2700 

ATGCAATTTT AAATTTAT CG CCACGATAAA 2760 

TAACTACTGC TTGTCTCAAG TTTGGATGCG 2 820 

TTAAAAAGAC TGACTTGCGT CCATTTTTGC 2 8 80 

TTAAATCAAA ATGTTTTTGA TTCACATCTG 2 940 

CTGACAATGC ATTATTCGGG TCACCATTAA 3 000 

GTCCATAACT ACCTTTTTCT GTTTCGTTGA 3 060 

ATGCATTTTT CTGTGTCATA ATGTATGCGC 3120 

AATTTGCAGG AATTGTACTG CTATCCCCAT 3180 

TAACAAATTT TTTAGATAAA ATGCCTGCCG 3240 

GCATCGATTG ATCTGTCGTA ATTTTAACAA 3300 



660 



TATAAGCTTT AATCAACTTA TCATAGATTO 
ACTGATCGAT GTOCTCATCT TTTAATATCT 
5 AAGTATTATT GTTAGGCACA GACTTTTTAT 

CTTCAGCCGA TACACGCTCT CCAGTATTAC 
AATCATCATC TCTTAACAAG AAATAAAATG 

10 

GACTTAACGA ACCTTTCGTT GTTAAATGAT 
ACATATTCAT ATTAATTGAA TATACTGACG 

is GAATTTCACC ATCTTGTTGT GTCATCACAA 

TGTAATCAAA TTGTTGCCAT ATTAATGCAC 
CTAACACTTT ATTGTCATAT ACTAAATTCT 

20 CTTTATCAAA TACAACTTCA TCTTCAATTT 

TTTGAGTAGA AGCTTTATTT AAGAACTGGT 
ATCCTGTAGA ACTAAATAAT GCCGXCATAG 

25 AGTCATCAAT TTGGATATCA TAATTGCCGG 

CTGGTTGGAT ATTCATCTTC ACGTTAAATC 

TCATATCATT TTCATAACTT GCTTGTCCTA 

30 

CTTCAACTTT CGATGACTTT TGAG CCACTT 

ATACCAACGC TAAAACTATA ATTGCGATAC 

TTTTAATGAA TTCTTGGATC TAGTGCATCA 

35 

AAAACGACGA ACATAATACA AACACCAGGT 
TAGTSaCTAC CGGTACGTAA AATGTTGCCC 

40 CCTAGGAAAC TTAAACTACT TGTTGTTAAT 

ACAATCATAG GCGCAATCGC ATTCGGTAAA 
TCACCAGTGA TACGTGCTGC ATCTACATAT 

45 CGCATTGTCC GTGCAAATGA TGGTATATTA 

ATACTTGCTC CAAATGATGC AATAATTGCC 
ACTACATCTA AAATTCGCAT TATTAAATTA 

50 

CCTAGTAACA CACCAAAAAT AACTGCAATA 
AGCTTCGTTC CTACAACTAC GCGTGTAAAT 

o 

55 
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ATTTATCGTC CTTGTCTTTC TCTTTACGCA 3420 

TGATGTCATT TATATGTTTG TGCATATTGT 3480 

CACGTGCTCT ATCTAAAGAA AACTTAACAT 3540 

GTGCTTGTCC ATTGACCACT TTCGCAAAAT 3600 

CTTTATTGTC CTTATTCACA GCATAATCAT 3660 

CATTTTCATC TAATAATAAT AACCTTGTGT 3720 

GCGCAATTGA ACGTATTGGA TCCAATGTAG 3780 

GTGGCCGCGT ATCTCGTTCT CTACTATTGT 3840 

GTGAATTTGG CAATCCAACA CTATTTTTAT 3900 

TTTTTGATCC ATATAAAGGC GCCATATACC 3960 

GCTTATATGT TTGTTTAACA TCTGCTTCAT 4 020 

CTACATGTTT ATCTTTCAAT AAACTATTTG 4080 

CATAGTTCGG GTCACCAAAC ACTOTCATCC 4140 

CTTGACGTTG TGTACGATAG CTACCATAAT 4200 

CTGCATTTTC CAATTGATCT TTAACGATAT 4260 

GGAAATGTAT TGTTGGTCGC TCGCCTTTCA 4320 

CTGATTTCGT AGGGACACCA CAACCACTTA 4380 

TAATGATTTT CTTCACATCT ATCCCTACCT 444 0 

CGCACTGCAT CACCTATAAA ATTAAATGCT 4500 

ACAATAGCTA AATTACTGTG CGTTTCCAAG 4560 

CATTCAGCTA CATCAGGTGC AACACCAAGT 4620 

ACAACCACAC CTATATTTAA TGAAAAACGT 4680 

ATATAACGCC ATATGATATT CCAAGTGTTT 4740 

TCCATGCGTT TAATTTCTAA AACACTGGCA 4800 

CCGATACTTA AAGCAATAAT TAAATTTGGA 4860 

ACCGCTAACA ATAATGATGG AATTGCAAAC 4920 

TCAATATGAT TAAAATAACC TGCGATAGTG 4980 

ACTACTGAAA TAATTGAAAT TGAAAATGTC 5040 

AAGTCTCTAC CGAAATCATC AGTACCAAAC 5100 
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GTATCAAATG TAAATTGTGA CACAATTQAT AATGTCAOCA TOTAOACTAA AATAAGTAAC 5220 

CCGATAATCG CAATACGATG TCTAGTAGTT TTT CGTATAA ACGATTCCCA CCCGTTATAA 5280 

CTATGTATTT GCGATGTACG TTGGTAACGT CTAATACTTA CAAACATTAA TAATGTAAAT 5340 

ACGTTGCCTG TTAATGTCAT CAACAATAAC AACACTTCGA CGATACGTCG CCATAGGTCA 5400 

TGATGCTTCC ATGTTTGTTC CGTTGTTAAA ATAATAATTA AAATGATGGT TAAAACGATT 5460 

AGCAATGTTT CAGCAATATA GAACGTATCG GCCACATAAC CTTTAAAAAG ATTTAATGCA 5520 

CTCGTTAATA TAACTAAAAT ATAAGTTGCT ATGGCGTAAC TTGCGAATAA TTTTAAGGAA 5580 

GCTATCTTTG AATTAAGTTG TGCCATATGC CTCACTTCCT TTCGTTGATT TCACTACGTA 5640 

15 

ATTTTGOATC GATTAAAGCA TAAAATATAT CAATAATTAA GTTTGCTAAA GATATTACAA 5700 

TTGATATATA TACGACCCCA CCCATGACTG CTGGAATATC AGGTATTAGT TGTTTTTGGA 5760 

2Q CGATATAACG CCCGATACCA TTAATGTTAA ATACTTGTTC CGTCACTGCT GAACCGCCTA 5820 

GTAACTCTGC CACTAGAAGA CCAACTAACG TTACAATTGG AATAATGGCA TTTTTCAAAA 5880 

TATGTTTAAT AACAACTTGT GTCGTCGATA ATCCTTTTGC AT AAGCAG TT AAAACATAAT 5940 

25 CGctGCGCAT TACTTCAAGT ACAGAAGACC TTGTCATACG CGTGATAGAA GCAGCAATAC 6000 

TTGTTCCAAT GACAAGTACA GGTAAAATCA ACGATATTGG ATGTTCTGGC ATATAAGATG 6060 

GTGGCAAAAT ATCCAATTTC AATGAGAACG CTAAAATGAA TAATAGCCCT TGCCAGAAAC 6120 

TTGGAATAGA TAAACCAATT AATG CAATT A TCATTAACGT GATATCAAGC CAACTATTTC 6180 

GCTTCATCGC ACTGATAATA CCAATTGGTA TTGCAATAAT TAATGCCACC ATTAGCGCTA 624 0 

ATACTGCGAC AATTATTGTA ATTGGAATTC TTTCGCCAAC TGCTTTAGTC ACAACCTCAT 6300 

TCCCTTTGTA AGTCGTACCT AAGTCAAAGG TAAAAACACC CTTGATGGTA TCCCACAATT 6360 

GAATSAAATA AGGTTCGTTA AGATGATGTA ATACATTGAA TTGATGTATC TGTGCCTTTG 6420 

40 TTGCATTTTG TCCCAGTATG CTATAAGCCG CATCAAGCGG TGAAAAATAC AGAATGGTAA 6480 

ACACACTGAC AATAACACCA ATGATGACAA TCACAGCCAT GACAATTCGT TCAAAAATAT 6540 

ATCTAACTAA TGGCTGTAAA TAAAAAGTCA ATAAGATGAA CATCGGCAAG GCCAATATCA 6600 

45 CTTTGATCAT GATGAACTTA TGAAATAATA CATTTTCAAA GTATGTTGAA AAATGTGCTT 6660 

GTTCAATATT CTTTGAACTC GTATTAGAAC TTTGTGCCTT GAATATTTTT AATGCTTCTT 6720 

TATGTATTTG TGTGGATGAC TTTTGCTGCG ATAAATATTT ATATTTTTGA TGTAACGCCT 6780 

BO 

GTTCAATTTC TGAAATTTCA GAATTATTAG CGTAAAAATT TTTCCTCTTA GCAGAAAAGA 684 0 

AAAACTTTAT CACTGCATAT AAAAATATTG GCAAGCTTAA TACCGATAAT ACAAACTTGT 6 900 

55 
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CTTGTAAAAT AATCTTGAGT AGATTACTAT GATATACAAA AGTATAGAAT AAATTTACAC 


7020 




ATTTGTGaAT 


AGGGAGGCAC 


AACATCATGT 


CAAATTTATT 


AGAAGTCAAC 


AGTCTGAATG 


7080 


s 


TACAATTCAA 


TTATGATGAA ACTACAGTTC AAGCGGTAAA AAACGTCTCT 


TTCGAATTAC 


7140 




GAAAAAAACA 


TATCCTAGGT 


ATTGTTGGTG 


AATCAGGATC 


AGGAAAAAGT 


ATTACCGCTA 


7200 


10 


AATCTATTTT 


AGGGCTACTA 


CCAGATTATC 


CAGATCACAC 


ATTAACAGGA 


GAAATTATTT 


7260 


TTAATGGGCA ATCGTTAAAT 


AATTTATCAA 


CTTCAGCGTT 


ACAACAAATT 


CGAGGTAAGG 


7320 




ATATTTCAAT 


GATTTTTCAA 


GATCCACTCT 


CTTCGTTGAA 


TCCAAGATTA 


ACGATTGGCA 


7380 


15 


AACAAATTAC 


AGAAGTAATA 


TTTCAACATA 


AACGTGTATC 


TAAATCTGAA 


GCAAAGTCGA 


7440 




TGACAATAGA 


CATTTTAGAA 


AAAGTAGGTA 


TAAAACATGC 


AACTCGACAA 


TTTGATGCTT 






ATCCACATGA 


ACTTTCTGGT 


GGTATGCGTC 


AACGTGTCAT 


GATAGCAATG 


GCATTGATTT 


/sou 


20 


TAAAGCCACA 


AATTTTAATC 


GCAGATGAaC 


CAACAACGGC 


ATTAGATGCC 


AGTACACAAA 






ATCAATTACT 


GCAGTTAATG 


AAGTCCCTTT 


ATGAGTACAC 


AGAAACATCT 


ATTATTTTTA 


/QOU 




TCACTCACGA 


TTTAGGCGCT 


GTGTATCAAT 


TTTGCGAOGA 


TGTGATTGTA 


ATGAAAGATG 


/ /40 


25 


GAAGTGTCGT 


TGAAAGTGGC 


ACGGTTGAAA 


GTATTTTTAA 


ATCGCCACAA 


CATACCTATA 


*7 ft r\ 




CAAAACGCTT 


AATAGATGCG 


ATTCCTGATA 


TTCATCAAAC 


GCGTCCGCCA 


AGACCGTTAA 


/OOU 


30 


ACAATGATAT 


TTTATTAAAA 


TTCGATCGCG 


TGAGyGgGAT TACACATCAC 


CGAGTGGCAG 


•join 


CCTATACCGA 


GCAGTTAATG 


ATATTAACTT 


GGCTATTAGA 


AAAGGCGAAA 


CATTAGG CAT 


Toon 




TGTCGGTGAA 


TCAGGGTCAG 


GGAAATCGAC 


ATTAGCTAAG 


ACGGTCGTCG 


GTCTAAAGGA 


a r\A n 


35 


AGTGTCAGAA 


GGCTTTATTT 


GGTATAACGA 


ATTACCATTA 


AGTTTATTTA 


AAGATGATGA 


OiUU 




ATTGAAATCT 


TTACGACAAG 


AGATACAAAT 


GATTTTTCAA 


GATCCATTCG 


CATCTATTAA 


8160 




TCCAAGATTT AAAGTCATTG ATGTGATTAA AOGACCACTA ATCATTCATG 


GGAAAGTCAA 


8220 


40 


AGATAATGAT 


GACATTATTA 


AAACTGTCGT 


ATCGTTGTTA 


GAAAAGGTTG 


GCCTAGATCA 


8280 




AACTTTCTTA 


TATCGCTATC 


CACACGAATT 


ATCTGGTGGG 


CAACGTCAGC 


GTGTAAGTAT 


8340 




CGCGAGAGCA 


CTTGCTGTTG 


AACCTAAAGT 


GATTGTTTGC 


GACGAGGCAG 


TGTCOGdTTT 


8400 


45 


AGAOGTTTCA 


ATTCAAAAAG 


ATATCATCGA 


GTTATTAAAA 


CAATTACAGT 


TAGACTTCGG 


8460 




CATCACTTAT 


TTATTCATCA 


CACATGACAT 


GGGTGTTATC 


AATGAAATAT 


GTGATCGCGT 


8520 


50 


TGCAGTTATG 


AAAAATGGCG 


AAATCGTTGA 


ACTGAATAAC 


ACAGAAGATA 


TTATCAAACA 


8580 


TCCGCAGTCA 


GACTATGCAA 


AGCAACTTAT 


TTCAGAAGTA 


GCAGTTATTG 


CTAAATAAAA 


8640 




GTCATGCGTT 


GTGCAACTTT 


ATCACTGTAT 


GGTCTGAAAT 


AAATTGCGCG 


ACTTCTGATG 


8700 
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TATCAAGTTT TAGGTGCTTT GCCATGATTT AAGAGTCACC CCCATACTTT 


GGGCATTTTA 


8820 




ACGCCAGAAT AAATCCCCCG CCACTATGTG AAGTGTGGGG GATTATTTAT 


ATTTTATTAG 


8680 


5 


AATATTCAGA TTTTTGAGTG TGTCAACTTA GCTTAGTCAA TGTATATTTA 


ACGTCACTTA 


8940 




CTCTTTTTCT TTCATAATTA ACACATTCAA ATAAACTTTG ATCAAAAAAC 


ACAAAGTTAA 


9000 


10 


AAGTACCATC TTGTAATATG CTCTCATACA TTATCCCGTC ATATTTAAGG 


CTTCGAATAT 


9060 


AATCAGCTAA ATATTGAAAT GGCAAATAAT CTATTCCTTG TTCATCGCTT 


GGATTTGTTA 


9120 




TTCCTTTATG AATCTTTTTT AATGTTTGGT AATTTACAAA ATACTTTCTA AATCCATCAT 


9180 


IS 


CGCCAGCTTT GATTGCATTA CTAGTTAAAT TAGTTAAATT OGCAATTTTC 


AATTTCTCTT 


9240 




TTGTCACGTT TTTTTGTAAC TTAACCTTAC CTATATAAAT AATGTCATTA TGCTTAGGTT 


9300 




TAACTTCTTC TATACTGACC TGTTCTTTTG TACTAAGGTA TAATACGCTT 


ATCCATTTAG 


9360 


20 


AATTCAATCT TCCTGCCGTT GCAAATCCCT TTGGTGGTGA CATTAGTTCA 


CTTTTCTCTG 


9420 




TAATGAACTT AACTATTCTA GATCTATATA ATGGTTCAAA TCTTTCTCTA AATTCCTCAA 


9480 




TACTATAGTA ATTAGTAGTG ATATCGAGAA AGAACGCTAA ATTCTCTAAA 


TTGATCATAT 


9540 


25 


TTTTATGAAA TCTATTTTTA TACTTCAAGC TCTCACAAAA TCCATCCCAG 


TCATTATTTG 


9600 




CTACAATTAG ATTTTTATTT GTATATTTTT TATCGTTTAT GATTTTAGCG 


CCTACTAAAT 


9660 


30 


CTTCCAACAC TCGTCTATCT AAATTTTCAT CATCTTTAAA AAGTTCATTT 


AAAATACAAC 


9720 


TTATTTGAGC TTCCTCAACA TTAAATATAC TCCAGTCGTC TTTTAATGCT 


ATTTCAATCT 


9780 




TTTTACCTTC TTTTGGGCTA AAAGTATCTG GTAAATTTAT ACTAATATCA 


TATAATTCTA 


9840 


35 


ATGCTGGTCT TAAATAATCT CTAATAAGTT CTAATTTATC TATGTCCTTA 


GTCGTATCAA 


9900 




ATATTTTAAC ACCAAGATGA TTGTTATCAA TATCACAATT GTCAAATTTG 


CTATTTATCA 


9960 




TTTGCAATGA TTTCTACGAT TTCAGTATTA TTAAAACATT TTTCACATAT 


TTTCATTTTG 


10020 


40 


AGACtCCAAG TATCTATTCA TAATTTCTAG GTGATGCATG ATAGATAACC 


TTTTAATTAA 


10080 




ACCTAATCCT GGATa CTTAT TATTTTCATT TAATTCTTCA AATTGTCCCA 


AGCGCATAAG 


10140 




ATCTATTTTT AATATCTAAG TTTTTTGACC ATGTTACTAA TT 




10182 


45 


(2) INFORMATION FOR SEQ ID NO: 117: 







(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3491 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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AACTCAGGCA ATTGAAACAG CATTAGGTGC 

AAAAGATGGA CGCCAGGCTA TTCAATTTTT 

5 

TTTACCATTA AATGTTATAC AGAGTAGAGT 

AGAGGCAAAC GGATTTATTA GTATCGCTTC 

AAATATTATC GGGAATTTAT TAGGTAATAC 

10 

TGAATTGGCA CGTGCGATTA AATATCGAAC 
AAATCCTGGT GGtTCTATGA CTGGTGGTGG 

1S AAAAGACGAG TTGACAACAA TGAGACACCA 

ATTTGAACAA CAATTTAAAG AGTTGAAGAT 
TGAAAAAAGT CAAAAGCATA ATACACTTAA 

20 CGATAGATTA ACTACACAAG AAACACAAAT 

AAAAAATGAT GGTTATACGA GTGACAAAAG 
TCTAGAAAGT ATTAAAGCAT CTTTAAAACG 

25 ACTTTCTAAA GAAGGTAAGG AAAGCGTTAC 

ATCTGATCTT GCTGTGGTTA AAGAGCGTAT 
AAATAATCAA AATCAACAAA CTAAACATCA 

30 

CTTTAATTCG GATGAAGTGA TGGGCGAACA 
TGGTCAACAA GAAACGAGAA CACGCTTATC 

3S TATTGAGTTG AATGAACAAA TCGATGCGCA 

TATTTTAGCT ATCGAAAATC ACTACCAAGA 
ATT»TTCAT CATGCGATAG ATCATTaAAT 

40 ArATCTGAAT ATACGaGTGA TGrATCGATg 

AGaTGyCGAT TGATG r ACT A GGTCCTGTAA 
TAAATGAACG TTATACATTT TTAAGTGAAC 

45 CATTAGAGCA AATTATAAGT GAAATGGATC 

TCCATGCTAT TCAAGGACAT TTTACAGCTG 
CAGAATTGCA ATTAACTGAA G C CG ATT ATT 

SO 

CACCGGGTAA AAAGTTGCAA CATTTATCGT 
CTATTGCTTT ACTATTTGCA ATTTTAAAAG 

55 



TTCATTACAA CATGTCATTG TAGATTCAGA 60 

AAAAGAACGT AATTTAGGTC GTGCGACGTT 120 

GGTAGCGACT GATATTAAAT CTATTGCTAA 180 

GGAAGCAGTT AAAGTAGCAC CAGAATATCA 240 

GATTATCGTT GATCATTTAA AGCATGCAAA 300 

TCGTATTGTT ACTTTGGAAG GTGATATTGT 360 

CGCTCGTAAG TCAAAAAGTA TTCTGTCTCA 420 

ATTAGAAGAT TACTTGCGTC AAACAGAATC 480 

AAAAAGTGAT CAATTAAGTG AACTGTATTT 540 

AGAGCAAGTG CATCATTTTG AAATGGAGCT 600 

AAAAAATGAT CATGaAGAAT TCGAATTTGA 660 

TCGACAAACT TTGAGTGAAA AAGAAACTTA 720 

ACTAGAAGAT GAAATTGAAC GCTACACAAA 780 

TAAAACACAA CAAACCTTAC ATCAGAAACA 840 

TAAAACACAA CAACAGACAA TAGATCGATT 900 

ATTAAAAGAT GTTAAAGAAA AAATTGCATT 960 

AGCTTTTCAA AATATTAAAG ATCAAATTAA 1020 

AGATGAATTA GATAAATTG A AACAACAACG 1080 

AGAAGCTAAA CTACAAGTTT GTCACCAAGA 1140 

TATTAAAGCT GAACAATCAA AG CTAGATGT 1200 

GATGrATATC AATTGACTGT TGAACGTGCG 1260 

ACGCATTACG TAAAAAAGTT AAGTTAATGr 1320 

ACTTAAATGC AATTGAACAA TTTGAAGAGT 1380 

AACGTACAGA TCTTCGTAAA GCTAAAGAAA 1440 

AAGAGGTTAC TGAAAGATTT AAAGAAACTT 1500 

TGTTCAAACA ATTGTTTGGT GGAGGCGATG 1560 

TAACAGCTGG TATTGATATT GTGGtACAAC 1620 

TACTGAGTGG TGGTGAGCGT GCATTAACTG 1680 

TAAGATCTGC ACCTTTTGTT ATATTAGrTG 1740 
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TATCAGACGA 


AACACAATTC ATTGTTATTA CACACCGTAA AGGAACAATG GAATTTGCAG 


I860 




ATAGGTTATA 


CGGTGTAACA ATGCAAGAAT 


CAGGTGTTAC TAAACTTGTG AGTGTGAATT 


1920 


5 


TAAATACAAT 


AGATGATGTG 


TTGAAGGAGG 


AGCAATAATG AGCTTTTTTA AACGCTTAAA 


1980 




AGATAAGTTT 


GCAACAAATA AAGAAAATGA AGAAGTTAAA TCCTTAACAG AAGAACAAGG 


2040 


10 


TCAAGACAAA 


TTAGAAGATA 


CACATTCTGA 


AGGTTCAACG CAGGACGCAA ATGATTTAGC 


2100 


AGAAAATGCT 


GAAGTGAAAA AGAAGCCACG 


CAAGTTGAGT GAAGCGGATT TTGATGACGA 


2160 




TGGCTTAATA 


TCAATTGAAG ATTTTGAAGA 


AATTGAAGCT CAAAAAATGG GTGCTAAATT 


2220 


15 


TAAAGCAGOA 


CTCGAAAAAT 


CTCGTCAAAA 


TTTCCAAGAA CAATTAAATA ATTTGATAGC 


2280 




GAGATATCGT AAAGTAGATG AAGACTTTTT 


TGAAGCTTTA GAAGAAATGT TAATCACTGC 


2340 




AGACGTCGGT 


TTTAATACAG 


TGATGACGTT 


AACTGAAGAA TTACGTATGG AAGCACAACG 


2400 


20 


ACGTAATATT 


CAAGATACTG 


AAGATTTGCG 


TGAAGTCATT GTTGAAAAGA TCGTAGAGAT 


2460 




TTACCATCAA 


GAAGATkATA ATTCAGAAGC 


TATGAACTTA GAAGATGGTC GTTTAAATGT 


2520 




CATTTTAATG 


GTTGGTGTGA ATGGTGTTGG 


TAAAACAACA ACAATTGGAA AATTAGCTTA 


2580 


25 


CCGATATAAA 


ATGGAAGGTA 


AAAAAGTAAT 


GTTAGCTGCG GGCGATACTT TTAGAGCGGG 


2640 




TGCTAiTGAT 


CAATTGAAAG 


TTTGGGGCGA 


ACGTGTTGGT GTAGACGTAA TTAGCCAAAG 


2700 


30 


TGAAGGTTCT 


GATCCAGCTG 


CTGTTATGTA TGATGCgATT AATGCCGCTA AAAACAAAGG 


2760 


TGTTGATATT 


TTAATCTGTG 


ATACCGCTGG 


ACGTTTACAA AATAAmACAA ATCTAATGCm 


2820 




AGAATTAGAA 


AAAGTTAAGC 


GTGTAATTAA 


TCGAGCAGTG CCAGATGCGC CTCATGAAGC 


2880 


35 


ATTACTATGT 


TTAGATGCTA 


CAACTGGTCA 


GAATGCGTTG TCACAAGCTA GAAACTTTAA 


2940 




AGAAGTAACA 


AATGTTACAG 


GTATTGTATT 


AACGAAATTA GATGGTACAG CCAAAGGTGG 


3000 




TATCGTATTA 


GCCATTCGTA 


ATGAATTGCA 


CATCCCAGTT AAATATGTAG GTTTAGGTGA 


3060 


40 


GCAAlTAGAT 


GACTTACAAC 


CATTTAACCC 


TGAAAGTTAT GTCTACGGCT TATTCGCTGA 


3120 




TATGATTGAA 


CAAAATGAAG AAATAACAAC 


AGTTGAAAAT GATCAAATTG TAACAGAAGA 


3180 




AAAGGACGAT 


AATCATGGGT 


CAAAATGATT 


TAGTtAAAAC GTTACGAATG AATTATTTGT 


3240 


45 


TTGATTTTaT 


CAATCCTTAT 


TGACGAATAA 


ACAACGTaAT TATTTGGAAT TATTTTATCT 


3300 




TGAAGATTAT 


TCTTTAAGTG 


AAATCGCAGa 


TACTTTTAAT GTGAGTAGaC AAGCAGTTTA 


3360 


SO 


TGATAATATA AGAAGAACTG 


GCGATTTAGT 


TGAAGATTAT GAAAAGAAAT TGGAATTATA 


3420 


CCAGAAATTT 
AGAACAAATA 


' GAGCAACGCC 

> C 


GAGAAATATA 


. TGATGAAATG AAACCACATT TAAGTAATCC 


3480 
3491 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4253 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 


(xi) SEQUENCE DESCRIPTION: 


SEQ ID NO: 


118: 






ACTACGTTTT ATAATTATAA GTACGTAATT AACATATTAA 


CATATCGCAA 


GTATGTATTT 


60 




AAATAAgATT GTTATAATTT CAAAGTTCAT 


CCAAGaTTAT 


GGCGTTTGCA 


TTTACCTATT 


120 


15 


AAAAACGTTA TTATATCAAA GATGCGAAAG 


ATAATACGGG 


TTTATTTTAT 


GAAAGTOAGA 


1B0 




AGGATAAAAT GGATAATGAG CAACGCTTAA 


AAAGAAGAGA 


GAATATAAGG 


AATTTCTCGA 


240 




TTATAGCACA TATTGACCAC GGAAAATCTA CATTGGCTGA TAGAATTTTA GAAAATACCA 


300 


20 


AATGAGTTGA AACAAGAGAT ATGCAAGATC 


AGTTACTAGA 


TTCAATGGAT 


TTAGAAAGAG 


360 




AACGTGGTAT TACAATCAAA TTAAACGCgT ACGTTTAAAG TACGAAGCTA AAGATGGAAA 


420 




TACTTATACA TTCCATTTAA TCGATACGCC 


TGGACACGTC 


GATTTTACAT 


ATGAAGTGTC 


480 


25 


ACGTTcTTTG GCAGCTTGTG AGGGCGCGAT 


TTTAGTAGTA 


GATGCGGCTC 


AAGGTATCGA 


54 0 




AGCACAAACA TTAGCAAATG TTTATTTAGC 


ATTAGATAAT 


GAGTTAGAGT 


TATTGCCTGT 


600 


30 


TATTAACAAA ATTGATTTAC CTGCTGCAGA 


ACCTGAACGC 


GTGAAACAAG 


AAATTGAAGA 


660 


TATGATAGGT TTAGACCAAG ACGATGTTGT 


TTTAGCAAGT 


GCTAAATCTA 


ACATTGGAAT 


720 




TGAAGAGATA CTAGAGAAAA TAGTTGAAGT 


TGTGCCAGCT 


CCAGATGGTG 


ACCCAGAAGC 


780 


35 


ACCACTAAAA G CGTTAAT AT TTGATTCTGA 


GTATGATCCA TATAGAGGGG 


TAATTTCATC 


840 




GATAAGAATT GTGGACGGTG TTGTTAAAGC 


CGGAGATAAA 


ATTCGAATGA 


TGGCCACTGG 


900 




TAAffiAGTTC GAAGTAACAG AAGTTGGAAT 


TAATACACCT 


AAGCAGCTTC 


CAGTTGATGA 


960 


40 


ATTAACAGTT GGTGATGTTG GTTATATTAT 


TGCAAGTATT 


AAAAATGTTG 


ATGATTCTAG 


1020 




GGTTGGTGAC ACCATCACAT TAGCTAGTAG 


ACCTGCATCA 


GAACCATTGC 


AAGGTTATAA 


1080 




GAAAATGAAT CCAATGGTAT ATTGCGGACT 


GTTCCCAATA 


GATAACAAAA 


ATTATAATGA 


1140 


45 


TTTAAGAGAA GCATTAGAAA AATTACAATT 


GAATGATGCA 


TCATTAGAAT 


TTGAGCCTGA 


1200 




ATCGTCACAA GCATTAGGTT TTGGTTATAG 


AACTGGTTTC 


TTAGGTATGT 


TACACATGGA 


1260 


60 


AATAATTCAA GAAAGAATTG AAAGAGAATT 


TGGTATTGAA 


TTAATTGCAA 


CTGCACCATC 


1320 


TGTAATTTAT CAATGTGTTT TAAGGGACGG 


TTCAGAAGTG 


ACGGTTGATA 


ACCCAGCACA 


1380 




AATGCCAGAT CGTGATAAAA TTGATAAAAT 


ATTTGAGCCA 


TATGTTCGTG 


CAaCTATGAT 


1440 
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10 



TATAAATATG GACTATTTAG ATGATATTCG TGTAAATATT GTTTATGAAT TACCTTTAGC 1560 

TGAAGTTGTA TTTGATTTCT TCGATCAACT TAAATCTAAT ACTAAAGGAT ATGCATCATT 1620 

TGATTATGAA TTCATCGAAA ATAAAGAAAG TAATTTAGTC AAGATGGATA TTTTATTAAA 1680 

TGGTGATAAA GTGGATGCGC TAAGCTTCAT AGTTCATAGA GATTTtGCAT ATGAACGTGG 1740 

TAAAGCATTA GTTGAAAAAC TTAAAACGTT AATTCCAAGA CAGCAATTTG AAGTACCTGT 1800 

ACAGGCTGCA ATAGGACAAA AAATTGTAGC GCGTACAAAT ATTAAATCAA TGGGTAAAAA 1860 

CGTTTTAGCT AAATGTTATG GCGGTGACAT AAGCCGTAAA CGTAAATTAC TTGAAAAACA 1920 

15 AAAAGCAGGT AAAGCTAAGA TGAAAGCAGT TGGTAATGTT GAAATTCCAC AAGATGCTTT 1980 

CTTGGCTGTA TTGAAAATGG ATGATGAATA ATTTTAAAAA ATCAATTAAC AATTTACAAT 2040 

GAATAAAGTT TAATAACTAA AAAGAGGGAG CCTAGGATAA ATTAACGTCC TGGGCTTTAC 2100 

20 AATGTTATAT TGGCAGCCAT CGACAGAGTT AAAATGAGCT TATAACAATG GGGCCCCAAC 2160 

ACAGAAGCTG ACGAAAAGTC AGCTTACTAT AATGTGCAAG TTGGGGTGGG GCCCCAACAT 2220 

AGAGAATTTC GAAAAGAAAT TCTACAGGCA ATGCAAGTTG GGGTGGGACG ACGAAATAAA 2280 

25 

TTTTGCGAAA ATATCATTTC TGTCCCACTC CCTTATGCAT GAGTTTTACT CATGTAATTT 234 0 

TATTTTTAAG GACATATTAG ATCTGGCTAA TGTGTAAGAG CCACTACATA ATAAATCATT 24 00 

AGTGGTTCTT TATTATTTCT ATCTCACTCC CTCTAAACAA GAATAAATAT TAAAATGAAT 24 60 

30 

CGATATATTA GACAATCATT GATTAAACGT TAAAGTTAAA AGTAAGAATA ATTGCAGATA 2520 

GTCCAACAGG ATATAGCCGA TTGGATAAAA AGTCTGAGAA GCGGGGCATT AAAATGACGG 258 0 

35 TACAAAGTGC ATATATACAT ATTCCATTTT GTGTAAGAAT ATGTACATAT TGTGATTTCA 2640 

ATAAATATTT TATACAGAAT CAACCTGTAG ATGAGTACTT AGATGCACTA ATCACAGAAA 2700 

TGTCTACAGC AAAATATAGG ATCTTAAAGA CCATGTATGT AGGTGGCGGC ACACCAACGG 2760 

40 CCCTTTCTAT TAATCaGTTG GAAAGATTAC TTAAAGCAAT ACGTGATACG TTTACAATCA 2820 

CAGGCGAGTA TACATTTGAA GCAAATCCTG ATGAGTTAAC TAAAGAGAAA GTCCAACTAT 2880 

TAGAGAAATA TGGAGTAAAA AGGATTTCAA TGGGCGTTCA AACATTCAAG CCGGAGTTAT 2940 

TGTCTGTTTT AGGTAGAACG CACAATACTG AAGATATTTA CACTTCGGTG TTAAATG CTA 3000 

AAAACGCAGG TATTAAATCA ATCAGTTTAG ATTTAATGTA TCATTTACCG AAACAGACGA 3060 

TTGAAGATTT TGAACAAAGT TTAGATCTAG CTTTAGATAT GGATATTCAA CAT ATTT CG A 3120 

GTTACGGCTT AATACTTGAA CCTAAAACCC AATTTTATAA TATGTATAGA AAAGGCTTGC 3180 

TCAAACTTGC TAATGAGGAT TTAGGTGCTG ACATGTATCA GTTGCTGATG TCTAAGATAG 3240 
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5 



10 



20 



AACATAATAA 


GGTTTACTGG 


TTTAATGAGG 


AATATTATGG 


ATTTGGAGCA 


GGTGCAAGTG 


3360 


GTTATGTAGA 


TGGTGTGCGT 


TATACGAATA 


TCAATCCAGT 


GAAT CATT AT 


ATCAAAGCTA 


3420 


TAAATAAAGA 


AAGTAAAGCA 


ATTTTAGTAT 


CAAATAAACC 


TTCTTTGACT 


GAGAGAATGG 


3480 


AAGAAGAAAT 


GTTTCxTTGGG 


TTGGGTITAA 


ATOAAGGTGT 


GAGTAGTAGT 


AGGTTCAAAA 


3540 


AGAAGTTTGA 


CCAATCTATT 


CAJVJVG1Y3TPT 


TTGGTCAAAC 


AATAAATAAT 


TTAAAAGAGA 


3600 


AflG&ATTAAT 

#WUrW*X innX 


*TY3T Afi A A A & fS 


A AfV; ATY2TY2 A 


A a X XAl. 


AAATAGAGGG 


AAAGTCATAG 


3660 


w xxvixunwsi 


111 4wnnU\. X 


'CIVf^Ti AT* A A 
a 1 liinlAn 


ATY2ATTAAAA 


AAAJVTTGAAA 


X X A UWW 1 VI 


3720 


X innwil XVacn 


^^^P^P 7A ^^^P^P^Ps^S & 
v* X 1aI> X 1 1UA 


^^^^ A & ^P^P^P^S ft ^P 


A A ATT AT A AT 
/uinl Inlmi 


lAUWt% X X\M 


GATAA£VIY?Af2 




^^^ni A^ft^5 & 


uiuAAnnUil 


& TT & A T 




fiT AT ATT A A A 
Win 1H1 liuvi 


rvif A ATTY5TT 


3840 


. GAGGA1 xATG 


TTGATTTTGG 




GGTTCTAAAA 


UiL Xnn X X 


fZTYl A f* A T A A r* 




TTGAATGTTA 


GTCCTGCTAC 


AATTAGAAAT 


«"|yi m j\ » 

(jAviAIvjAAAU 




TTTAAACTAT 




ATCGAGAAGA 


CACATAGTTC 


TTCAGGGCGT 


TCGCCATCAC 


AATTAGGTTT 


TAGGTATTAT 


4020 


GTCAATCGTT 


TACTTGAACA 


AACATCTCAT 


CAAAAAACAA 


ATAAATTAAG 


ACGATTAAAT 


4080 


CAA'TTOTTAG 


TTGAGAATCA 


ATATGATGTA 


TCATCAG CAT 


TGACATATTT 


TGCAGATGAA 


4140 


TTATCAAATA 


XATCTCAATA 


TACAACTTTA 


GTTGTTCATC 


CTAATCATAA 


ACAAGATATT 


4200 


ATCAATAATG 


TACACTTGAT 


TCGTGCTAAT 


CCTAATTTAG 


TTATAATGGT 


TAT 


4253 



SO 

(2) INFORMATION FOR SEQ ID NO: 119: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 33 95 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



40 "(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 119; 

TCCCTAATCG AACAAAATTA TGCGCATAAA CAAAGTAGAT TGATATAAAA TTCTTAATTA 60 

TCAGAATATA TTTACAAATC TGAATTTTAT TAGTATATTG GrTAGTrTTC ATAGAGGCAT 120 

45 

GACGGTaTTT GAGCAGGATT TTAAATCGGg ATTTTATAAT CGATTTAAGA GAGGCCACtT 180 

TGCTTGcACA TTAATACTGT CAATGGGAGG GOAATGTATA TGAGTrAAGC ACATCAATTA 240 

ATTCAAGAGG ATGAACATTA TTTTGCGAAA TCAGGACGTA TTAAATATTA TCCGTTAGTG 300 

SO 

ATTGATCATG GATATGGAGC AACATTGGTT GATATTGAGG GGAAGACATA TATCGATTTG 360 

TTATCGAGTG CGAGTTCTCA AAACGTAGGT CATGCACCTA GAGAAGTAAC AGAAGCGATA 420. 
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GTACGTTTAG CTAAGAAGCT TTGTGAGATT GCACCTGGAO ATTTTGAAAA AAGAGTGACC 540 

TTCGGATTAA CCGGATCAGA CGCAAATGAT GGCATCATTA AATTTGCCAG AG CAT AT ACA 600 

5 

GGGCGTCCTT ATATCATTAG TTTCACTAAT GCATATCATG GTTCAACTTT TGGCTCATTG 660 

TCTATGTCAG CTATTAGTTT AAATATGCGC AAACATTATG GTCCGTTATT GAATGGTTTT 720 

TATCATATTC CGTTTCCAGA TAAATATCGT GGTATGTACG AGCAGCCACA AGCTAATTCA 780 

10 

GTAGAAGAAT ATTTAGCACC CTTAAAAGAA ATGTTTGCGA AGTATGTACC TGCTGACGAA 84 0 

GTAGCATGTA TTGTTATTGA AACGATACAA GGCGATGGTG GACTTTTAGA ACCAGTTCCA 900 

IS GGGTATTTTG AAGCGTTAGA AAAGATTTGT CGTGAACATG GTATTTTAAT CGCTGTCGAT 960 

GATATTCAAC AAGGTTTTGG GAGAACAGGT ACATGGAGTT CAGTCTCGCA TTTTAATTTT 1020 

ACGCCTGATT TAATCACTTT CGGAAAATCC TTAGCAGGTG GTATGCCTAT GTCAGCAATT 1080 

20 GTTGGACGCA AAGAGATTAT GAATTGTTTA GAAGCACCAG CACATTTATT TACAACAGGT 1140 

GCTAATCCAG TTAGTTGTGA AGCTGCATTA GCCACAATTC AAATGATTGA AGATCAGTCG 1200 

CTTCTTCAGG CTAGTGCGGA AAAAGGGGAA TATGTTAGGA AACGAATGGA TCAATGGGTA 1260 

25 TCTAAATACA ATAGTGTAGG CGATGTTAGA GGTAAAGGTC TGAGCATTGG TATTGATATT 1320 

GTTTCCGACA AAAAACTCAA AACACGTGAT GCCAGTGCGG CACTTAAAAT TTGTAATTAC 13 80 

TGCTTTGAGC ATGGCGTAGT TATTATAGCT GTAGCAGGAA ATGTGTTGCG ATTCCAACCG 144 0 

30 

CCATTGGTAA TAACATATGA GCAATTAGAC ACGGCGTTAA ACACTATAGA AGATGCACTG 1500 

ACTGCTTTGG AAGCAGGTAA CTTAGATCAA TATGACATAT CTGGACAAGG TTGGTAATAG 1560 

CGATTATCTT AATATAAAAT AAAAAATCAT TTCCACATCT GGATGTTAAT CAGATGGGAA 1620 

ATGATTTTTT TTATTTTTTA TTTTGGTGGG TGGTATTCAG CTACGTCATT TTTCTTAGAA 1680 

TGTCTAAGTC CATAACTTAA ATATAGGATG ATACCAACAA TAAACCAAAT TAAAGTGTAT 174 0 

40 AATTTCGCTT CGAATCCTAA TCCCCAGAAT ACTAGCAATA CTAAAACAAA TGTAATTGCT 1800 

GGTAACACAG GATATAAAGG TAATTTAAAT GCAGGAATTG GTAGATCTTT ACCTTcACGC 1860 

TTTCTCAAAC GATACATTGC TAATGAAACG AACATAAATG CAACAAGTGT ACCTGCTGAA 1920 

45 ATTAATTGTG CTAAAAATGC GAATGGGAAC ATAGAACCAA TTAAAACACC AATAATAGTA 1980 

AGTATAACTA GTGCGCGATT AGGTAAATGT TTGTCGTTTA AGTGGCTTAA CCATGAAGGT 204 0 

AATAAGCCGT CACGTCCAAA TGAATAAAGT AAACGTGAGC CTGCTAACAT CATACCAATT 2100 

50 

AATGCTGTAA ACATACCGAT AACAGAGATA GCTTGAACAA TAGCTGCTAC AACACCATGA 2160 

CCACTTTGAC GTAAAGCCCA ACCAACAGGT TCAGCATTGT TTGCGTATTG TGAGTAATGG 2220 
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CCAAGAATAC CTCTAGGCAT TGTCTTTTGA GGATCAAGTG CTTCTGCTGA GTTTGCTOCG 2340 

ATAOAATCGA AACCGATATA CGCTAAGAAA ATCATTGAAA CACCAGCATA TATGCCTTGC 2400 

CATCCACCAA AGTCACCTGT AGCAGTTACT TTGTGTTCTG GAATAAATGG CACATAGTTA 2460 

CTAACATTTA TTGCTGTTAA ACCTACGATG ACAAATAAAA TAATAGCTAA TACTTTTAAA 2520 

ATAACTAAAA TATTTTCCAT ACGAGCTGCT TCCGACATAC CACGTGATAG TAATAATGCA 2580 

10 

GTTAATAAAA TAACGATAGC AGCAATAATA TCGATAAAAC CGCCATTTGT ACCAAATGGA 2640 

TTTOATAATG CTGCAGGTAA TTCGATGCCA ATTGGTTTCA CAAGTCCGCG TAAATTCGCT 2700 

1S GAGAATCCTG ATGCAACAAA GGCTACGGCG ATAAAATATT CAGCTAATAG AGCCCAACCG 2760 

GCAACCCATC CAAAAAATTC ACCAAATAAT ACATTGACCC AAGAATAGGC TGAACCTGCA 2820 

AATGGCATAG CGGCAGCCAT TTCTGCATAA GTAAATGCAA CTAAACCAGC AACAATAGCA 2880 

20 GCGAGTAAGA ATGATAACGC AACGGCCGGT CCTGCATGTT CTGCAGCAAC AATGCCAGGT 2940 

AGCGTAAAGA TAGATGTCGA TACAATTGTT CCTACACCTA AAGCTAAGAA ATCACGCACC 3000 

CGAAGTGTAC GCTTTAAATG ACCATCTTTA TTTTGATAGA TAGCCGGATC CTCTTTTCGT 3060 

25 GCTATTTTAT TGAAAAAACT TCCCATAAAC TTTCCTCCCA AACATTCATA AACAATTCTA 3120 

TACGGTGTTT TTTAATATGT TATATCATAG CACAAATAAT CAATATTTTG TCTAAAAATT 3180 

CTGAAAAATC ACAACTTTAT GTTACGTATT AATGACTTGT CTTGATAACA TCCATAGATT 3240 

30 

TTTTAAATGA TAAAACTGAT TATAACAGAT ATTAAATGAA TAAGTACTAT TTTTTGCnAA 3300 

TTTTCTAACA ATTTTGCACA TTATATGTTT AAAATCAATT TCATGTTTAT GGTCTGATTG 3360 

3s GCTAGTGTGT ATGAAATGTA AnTCTTTGAC TnnGA 3395 

(2> INFORMATION FOR SEQ ID NO: 120: 

~ (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 13508 base pairs 
40 (B) TYPE: nucleic acid 

(C) STRAND ED NESS : double 

(D) TOPOLOGY: linear 



45 (xi> SEQUENCE DESCRIPTION: SEQ ID NO: 120: 

ATCAGGTAAT GCCATGCGTT TAGCTGAAAA TTTTTTCAGA ACGTTTAAGT GATATCGGAC 60 

ATCAAGTTGT TTTGATGTCA ATGGATGAAT ATGATACGAC AAACATCGCG CAGTTAGAAG 120 

SO 

ATTTATTTAT TATTACGTCT ACTCATGGTG AAGGAGAACC GCCTGATAAT GCATGGGATT 180 

TCTTTGAATT TTTAGAAGAC GATAACGCAC CTAATTTAAA TCATGTGAGA TATTCAGTAC 240 
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TACTAGAAAA TCTAGGCGCT GAGCGTATAT OTAAOCOTOT AGATTGTQAT ATTGATTATO 360 

AAGAAGACGC AGAAAAGTGG ATGGCAGACA TCATTAATAT TATTGATACC ACATCAGAAG 420 

5 GTATTCAAAG TGAATCGGTG ATAAGTGAAT CAATTAAGTC TGCCAAAGAA AAGAAATATT 4 80 

CTAAATCAAA TCCATACCAA GCAGAAGTAT TAGCGAATAT CAATTTAAAT GGTACCGATT 54 0 

CAAATAAAGA AACACGACAT ATAGAATTTT TACTTGATGA TTTTAGTGAA TCATATGAAC 600 

10 

CAGGAGATTG TATAGTAGCA TTACCGCAAA ACGACCCTGA ATTGGTTGAA AAACTAATAT 660 

CCATGTTAGG TTGGGATCCG CAATCTCCGG TGCCAATTAA TGATCATGGT GATACAGTTC 720 

1S CTATTGTTGA AGCACTAACA TCACATTTTG AATTTACTAA ATTAACATTG CCATTATTGA 780 

AAAATGCAGA TATCTATTTT GACAATGAAG AATTATCTGA AOGTATTCAA GATGAGTCAT 840 

GGGCGCGTGA ATATGTTATA AATCGGGACT TTATAGATTT AATAACAGAT TTTCCAACTA 900 

20 TAGAATTACA ACCTGAGAAT ATGTATCAAA TCCTTAGAAA ATTACCACCA AGAGAGTATT 960 

CGATTTCTAG TAGTTTTATG GCAACGCcAG ATGAAGTGCA TATTACOGTT GGTACGGTTC 1020 

GTTATCAAGC ACATGGACGT GAGAGAAAAG GTGTATGCTC GGTTCATTTT GCTGAGCGAA 1080 

25 TTAAACCAGG CGATATAGTA CCAATTTATT TGAAGAAAAA TCCGAACTTC AAATTTCCGA 1140 

TGAAGCAAGA TATACCGGTT ATTATGATTG GACCAGGTAC TGrAATTGCT CCTTTTAGAG 12 00 

CATATTTACA AGAACGTGAA GAACTTGGTA TGACTGGAAA AACATGGTTG TTCTTTGGTG 1260 

30 

ATCAACACCG TAGTTCTGAC TTTTTATATG AAGAAGAAAT AGAAGAATGG CTTGAAAATG 1320 

GAAACTTAAC ACGCGTAGAT TTAGCATTTT CAAGAGACCA AGAACACAAA GAATATGTAC 1380 

AGCATCGTAT AATGGAAGAA AGTAAACGTT TCAATGAATG GATTGAGCAA GGCGCACAAT 144 0 

3S 

CTATATTTGT GGCGATGAAA AATGTATGGC GAAAGATGTC CATCAAGCCA TTAAAGATGT 1500 

ATTGCTAAAA GAACGTCATA TTTCTCAAGA AGAAGCAGAG TTATTATTGC GACAAATGAA 1560 

40 ACAACAACAA CGCTATCAAC GTGATGTTTA TTAGCGATTG GTGTTAAATA TTTTAAGGTG 1620 

TAATGATGTA AAAAGATATA AAGGATGTTG CTCAACATGA ATATGCCATT AATGATAGAT 1680 

TTAACAAATA AAAATGTCGT CATAGTTGGT GGAGGCGTCG TTGCAAGTCG TCGGGCACAA 174 0 

45 ACATTAAATC AATACGTTGA ACATATGACG GTCATCAGTC CGACAATCAC TGAAAAACTT 1800 

CAAAATATGG TAGATAACGG TGTCGTCATA TGGAAAGAAA AAGAATTTGA ACCAAGCGAT 1860 

ATTGTAGACG CGTATCTAGT TATTGCAGCA ACCAATGAGC CACGTGTCAA TGAAGCGGTA 1920 

60 

AAAAAAGCCT TACCTGAGCA TGCCCTTTTT AATAATGTTG GAGATGCATC AAATGGCAAT 1980 

GTTGTATTTC CAAGTGCACT ACACCGCGAC AAG CTAACTA TCAGTGTATC AACTGATGGT 204 0 

SS 
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10 



1S 



20 



25 



30 



40 



45 



50 



TACAGTTCGT ATATCGACTT TTTATATACT TGCCGACAGA AAATAAAAGT ACTTQATATA 2160 

ACATATAACG AAAAGCAACA GTTACTGTCA CAAATTGTGT CACAAGAATA TTTAAATCAT 2220 

GACAAACAAG CTCAATTTTT AGCGTGGTTG GATGTAAGAT AATAATAGGG GACCGTCTAA 2280 

CCGTCTAAGG TAAGTCTTCT TATTTTAACT TTAACGCTTA ATCATTGAAA TTAAGACATG 2340 

GGCGGCTTTG TGAATAGTCT AATAATGAAG GATTTAAGCG ATAATGATAT GOGTTTTAAA 2400 

TATGAATATT ACAATAGAGA AAAAGATACG TAGAACAAAC TTAATAAAAT AGGTOGATAA 2460 

ATTGAAATCT GGTTGAAGTC GTTACTATCA TAGCGACCTT TAGCCAGATT TTTTGTGCAA 2520 

TAGAAAGCAA TAATAAAAAT GATAGATCAA AATGAAATAC AGGACAOGAT ATACAAGGAT 2580 

TAGTCATGCC ATGTTATCAA GTAGGAAAAT CAAACTTCAC TATTGATAGT TACGCAAAAA 264 0 

AGATTTTTTT GATAAAATGA GATAACTTAA ATATAAAAAA TTATATTAAT TATAATATTT 2700 

AAGTTAAAGA GGGGGATTAT GTAAATTGTA TTAAAAGTGG AGGGAGAAAA TAATATGAAT 2760 

AGTGATAATA TGTGGTTAAC AGTAATGGGG CTCATTATTA TTATTTCAAT TGTAGGTTTA 2820 

CTCATTGCCA AAAAGATAAA TCCAGTTGTA GGTATGACAA TCATACCTTG CTTAGGGGCA 2880 

ATGATTTTAG GATATAGTGT GACAGATTTG GTTGGATTTT TTGCTAAAGG GTTAGATCAA 2940 

GTCATCAACG TTGTTATTAT GTTTATCTTT GCCATTATTT TCTTTGGCAT CATGAACGAT 3000 

AGTGGTTTAT TCAAGCCGCT TGTCAAACGC TTAATATTAA TGACACGAGG CAATGTCGTC 3060 

ATTGTCTGTG CAATGACAGC TTTAATTGGC ACAATAGCCC AATTAGATGG GGCCGGTGCG 3120 

GTAACATTTT TGCTTTCTAT TCCTGCATTA TTACCTTTAT . ATAAAGOGTT AAATATGAAT 31 60 

AAATATTTAT TGATTTTACT ATTAGCATTA AGCGCGGCGA TTATGAACAT GGTACCTTGG 324 0 

GGAGGTCCAA TGGCTOGTGT AGCTGCAGTG TTAAAAGCCA AAAGTGTCAA TGAATTATGG 3300 

TATGCATTAA TACCTATTCA AATAATAGGT TTCATTCTTG TTATGTTGTT TGCGGTATAT 3360 

CTTCr<3ATTTA AAGAACAGAA ACGTATCAAA AAAGCAATAG AGAGAAATGA ATTACCGCAA 3420 

AGACAAGATA TAGATGTACA TAAATTAGTT GAAGTATATG AACGAGATCA AGATGTAAGG 3480 

TTTCCTGTAA AAGGACGTGC AAGAACAAAA TCATGGATAA AATGGGTGAA TACAGCTTTA 3540 

ACTTTAGCTG TTATTCTATC GATGTTAATA AATATTGCGC CACCTGAATT TGCATTCATG 3600 

ATAGGTGTTy CGTTGGCACT TGTTATTAAT TTTAAATCAG TGGATGAACA AATGGAACGA 3 660 

TTAAGAGCgC ATGCGCCGAA TGCATTAATC ATGGCTGCAG TGATTATTGC AGCAGGTATG 3720 

TTTTTAGGTG TACTAAATGA AACCGGTATG CTTAAAGCGA TTGCGACCAA TTTAATCAAA 3780 

GTGATTCCTG CAGAAGTAGG ACCATACTTG CATATTATTG TAGGTTTACT TGGCGTACCA 384 0 
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ACAGCAGGGC 


AATTTGGTGT 


ACCGTCTGTA 


TCAACAGCTT 


ATTCAATGGT 


CATAGGGAAT 


3960 




ATTATAGGTA 


CATTTGTCAG 


CCCATTTTCA 


CCAGCCTTAT 


GGTTGGCAAT 


TGGTTTAGCA 


4020 


5 


GAGGCAAACA 


TGGGCACGTA 


TATTAAGTAT 


GCATTCTTTT 


GGATTTGGGG 


ATTCGCTATC 


4080 




GTTATGTTAG 


TAATTGCAAT 


GTTGATGGGC 


ATTGTGACGA 


TTTAAGTATG 


AAAAAATAGA 


4140 


10 


AACTATGGTC 


ACGTTGCAAA 


ATGAAATAAT 


AGTTGCATAA 


ACATGTCGAA 


ATGACGGACG 


4200 


AATCTTTAAA 


CAATTTTAAA 


AATTAATGAA 


ATAATTGTGT 


AGAAATATGA 


ATTTCACTAA 


4260 




ATGTTAATAA 


CTTTGTGACG 


TTTTAGTTAA 


CAGACTAATA 


AAAATTTGAA 


AATACTATAT 


4320 


19 


ATAGTGGTAT 


AACGTAATGA 


GTAGACACAA 


TATATAGGAA 


GAAGGGGTAA 


AATGAATCAA 


4380 




ATCGAAGAAG 


CATTAACGGG 


TTTGATTTCT 


AAAGATCCTG 


CTATTGTTAA 


CGAAAATGCT 


4440 




AACAAAGATA 


GTGATACATT 


TTCAACAATG 


AGAGATTTAA 


GAGCAGGTAT 


CGTTT CTAAA 


4500 


20 


TCTTACGCAT 


TAAATCATTT 


ATTACCAAAG 


CACGTTGCAG 


ATGCACATCA 


AAGAGGGGAC 


4560 




ATACATTTT C 


ACGACTTAGA 


TTATCATCCA 


TTCCAACCGT 


TAACTAACTG 


TTGTTTAATA 


4620 




GATGCTAAAA 


ATATGCTACA 


TAATGGATTT 


GAAATAGGCA 


ACGCGAATGT 


AACTTCACCA 


4680 


2S 


AAATCAATAC 


AAACTGCATC 


AGCGCAGCTT 


GTACAAATTA 


TAGCCAATGT 


TTCTAG CAGT 


4740 




CAATATGGTG 


GCTGTAcGGT TGACCgCGTT 


GACGAATTAC 


tTAGTACATA 


TGCACGACCA 


4800 




TAATGAAGAA 


CAACATAGGA 


ATATsCGCAA 


AGCAATTTGT 


CAAAGAATCT 


GAAATTGATC 


4860 


30 


GTTATGTTGA 


TCAACAAGTC 


ACTAAAGACA 


TCAATGATGC 


GATTGAAAGT 


TTAGAATATG 


4920 




AAATTAATAC 


CTTATATACA 


TCTAATGGAC 


AGACACCTTT 


TGTAACATTA 


GGATTCGGCT 


4980 


3S 


TAGGTACAGA 


TCATTTAAGT 


CGCAAAATTC 


AACAAGCTAT 


CTTAAATACT 


CGTATCAAAG 


5040 


GCTTAGGAAA 


AGACCGCACG 


ACAGCGATTT 


TCCCGAAACT 


TGTATTTTCA ATTAAAAAAG 


5100 




GAACQVACTT 


TAGTCCGCAA 


GATCCGAACT 


ATGACATTAA 


ACAACTAGCA 


TTAAAGTGTT 


5160 


40 


CAACGAAACG 


TATGTATCCA 


GATATTTTAA 


ATTATGACAA 


ACTCGTAGAA 


ATATTAGGTG 


5220 




ATTTCAAAGC 


GCCAATGGGT 


TGTCGTTCAT 


TTTTACCAAG 


TTGGAAAGAT 


GCGGAAGGTC 


5260 




ATTTTGAAAA 


TAATGGTCGT 


TGTAATCTTG 


GTGTTGTTAC 


ACTTAATTTA 


CCTAGAATGG 


5340 


45 


CATTAGAATC 


TGCCGGTAAT 


ATGACGAAAT 


TCTGGGAAAT 


CTTTTATGAA 


CGTATCGATG 


5400 




TGTTACATGA 


TGCATTACTT 


TATCGTATAA 


ATCGTTTGAA 


AGATGCTGTA 


CCGAATAACG 


5460 




CAC CGATTTT 


ATATAAAAGT 


GGCGCATTTA 


ACTATAAATT 


AAAAGAAACA 


GATGATGTTG 


5520 


SO 


CTGAGTTATT 


TAAAAATAAA 


CGTGCAACGA 


TTTCAATGGG 


CTATATAGGG 


TTGTATGAAA 


5580 




CAG CTACTGT 


TTTCTATGGT 


CCAGACTGGG 


AAACATCTCA 


AGAAGCAAAA 


GCATTTACGC 


5640 
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GGTTCAGTAT TTmCAGTACG CCGAGTOAAT CGCTAcGGAT COTTTTTGTC GTTTAGACCA 
AGAGAGATTT GGAGATATTA AAGACATTAC AGATAAAGGA TATTATCAAA ACTCTTTCCA 
TTATGATOTA CGTAAAGATG TTACACCTTT TGAAAAGTTA GATTTTGAAA AAGATTATCC 
TTATTATGCG AGTGGTGGTT TCATTCACTA TTGTGAGTAT CCGAAATTGC AACACAATTT 
GAAAGCACTA GAAGCGGTAT GGGACTACTC TTATGACAAA GTTGGTTACT TAGGTACAAA 
TATTCCGATT GATCATTGTT ATGAATGTOA TTACGATGGA GATTTTGAAG CAACTGAAAA 
AGGATTTAAA TGCCCGAACT GTGGCAATGA TAATCCTAAA ACAGTTGATG TCGTTAAACG 
AACATGTGGT TACCTAGGCA ATCCAGTTCA ACGTCCAGTA ATTAAAGGCC GTCATAAAGA 
AATTTGCGCA CGAGTAAAAC ATATGAAAGC GCCTAAAGAA TGATACTTTT AGACATTAAA 
CAAGGACAAG GTTATATTGC TAAAATAGAA TCAAATAGCT TTGTTGACGG TGAAGGAGTA 
AGATGGAGTG TTTATGTATC AGGATGTCCA TTTAATTGTG TTGGATGTTA TAACAAAGCC 
TCACAAAAGT TCAGATATGG CGAGAAATAC ACTGATGAAA TATTAGCAGA AATATTAGAT 
GATTGCGATC ATGATTATAT ATCTGGGCTA AGTCTATTAG GTGGCGAACC ATTTTGTAAT 
TTGGATATTA CATTAAATCT TGTCAAAGCA TTTCGAGCAC GTTTTGGAAA TACAAAGACA 
ATTTGGGTAT GGACTGGATT TTTATATGAA TATTTAGCAA ATGATTGTAC AGAACGTCGA 
GAGTTATTAT CATACATTGA CGTTTTAGTA GATGGTCTAT TTATACAACA CTTATTCAAA 
CCTGATTTAC CATATAAAGG TTCTTTAAAT CAACGCATTA TAGATGTACA ACAATCACTC 
TCGCATGCGC GTATGATTGA ATATATAGTT AGTTGAATAT GTATTAGAAG TCAAGGTAAC 
ATTCGTTGCC TTGGCTTCTT TTTAGGTTAG GTACATAATT GAAAGTTAAT AAAAGCAATT 
CTTTATAAAA ATATATTGAT AGAATATGAC CTAACAATCA TTTTGATACC AATACTAAAA 
GTTGCATATC CGTTTTTTAA AAAAGTTGAA AGAGAAAAGT GGTATTTTAG TGGGAAGGAA 
GTCTAACTTT TTGGTAGCGT TTTACAATAA ATAAATATTC GTTAATAACG TATAAATATT 
CTTAAATGCC ATTCTAGTAA AATTTGTTAA ATTCGTTAAA TCGTAACTTA ACACTGTTAT 
TTTAGCGCTA TTAAGGTTTT GTTTATTACG GGAAAAATTA TATAAATATT CAATAATTGC 
CAAGTTTCAA ATTGTATGAA ATTTGCATTA TTATTAAATG TTAGTTATTG TCAATTTTGT 
GAATCAATAT AATTATTACA TTTTGAGATA AATCGAAACA GGATTCATAA AATTAATAAT 
TAGGGGGAGC ACAATTGAAA AAAGAGAAAG TTATGGACTG GACGACCTTT ATAGGGACAG 
TAGCTGTACT TCTTTTTGCA GTTATACCTA TGATGGCTTT TCCAAAAGCA AGTGAAGATA 
TCATCACTGG TATTAATAGT GCCATTTCTG ATTCAATTGG TTCGATATAT TTATTTATGG 
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TTGGTAAAGC AAGTGATAAA CCAGAATTTA ATACATTTAC ATGGGCGGCA ATGCTGTTTT 7560 

GTGCAGGCAT AGGCTCTGAT ATTTTATACT GGGGCGTTAT TGAATGGGCT TTTTACTATC 7620 

AAGTTCCACC AAATGGCGCG AAAAGTATGA GTGATGAAGC ACTCCAATAT GCGACGCAAT 7680 

ATGGTATGTT CCACTGGGGG CCAATTGCTT GGGCTATTTA TGTTCTACCA GCATTACCAA 7740 

TTGGTTATTT AGTATTTGTT AAAAAACAAC CGGTGTATAA AATTAGTCAA GCTTGTCGTC 7800 

CGATTTTAAA AGGTCAAACA GATAAATTTG TAGGTAAAGT TGTAGATATC TTATTTATCT 7860 

TTGGATTGCT AGGTGGTGCG GCAACATCAC TAGCGTTAGG TGTGCCATTA ATTTCTGCAG 7920 

1$ GCATAGAAAG ATTAACTGGT TTAGATGGTA AAAATATGAT TTTACGTTCG GCCATTTTAT 7980 

TAACAATCAC GGTTATATTT GCCATTAGTT CATATACAGG ATTGAAAAAA GGTATTCAAA 8040 

AGTTAAGTGA TATCAACGTT TGGCTATCCT TTGTACTTTT AGCCTTTATA TTTATTATTG 8100 

20 GACCGACTGT TTTTATTATG GAAACGACAG TGACAGGGTT CGGAAATATG TTGAGAGATT 8160 

TCTTTCATAT GGCAACATGG TTAGAACCAT TCGGTGGTAT TAAAGGTCGA AAAGAAACGA 8220 

ATTTCCCACA AGACTGGACA ATATTCTACT GGTCATGGTG GTTAGTATAT GCGCCATTTA 8280 

TCGGTTTATT TATCGCTAGA ATTTCAAAAG GTCGACGCCT TAAAGAAGTC GTGCTAGGAA 834 0 

CAATTATTTA TGGAACGCTT GGATGCGTAT TATTCTTTGG TATTTTTGGT AACTATGCTG 8400 

TGTATTTACA AATTTCTGGA CAGTTTAATG TAACACAATA TTTAAATACA CATGGTACAG 8460 

AGG CAACCAT TATTGAAGTG GTGCATCATT TACCATTCCC ATCATTGATG ATTGTACTAT 8520 

TCTTAGTATC TGCTTTCTTA TTCTTAGCAA CAACATTTGA TTCGGGTTCA TATATTTTAG 8580 

CGGCAGCATC TCAGAAAAAA GTGGTAGGCG AACCATTACG TGCCAATCGT TTATTCTGGG 8640 

CATTTGCATT GTGCTTATTG CCATTTTCAT TGATGCTAGT TGGTGGTGAA CGTGCATTAG 8700 

AAGTATTGAA AACTGCTTCA ATACTGGCAA GTGTGCCATT AATTGTTATT TTTATTTTCA 8760 

40 TGATGATATC ATTTTTAATC ATTTTAGGGC GCGATAGAAT TAAACTTGAA ACGCGTGCTG 8620 

AAAAATTAAA AGAAGTTGAA CGTCGTTCAT TGCGAATCGT TCAAGTATCa GAAGAAGAAC 8880 

AAGACGATAA TTTATAATTC AAAGCGGGTC TGGGACGACG AAATGaATTT TGTGAAAATA 8 940 

45 TCATTTCTGT TCCaTTCCCC TTTTTTTAGT AGCATTGTAG GATGAACTTT TAGGTTTTCA 9000 

TTAATGTTGT ACTAAAAGAT TTAATTTTTT AGTGCTCCAA GTACTTATTT ATTGTATGAA 9060 

GCATATTCTA AATCGAAGTT TGAAAGACTC TCATTGATTA TTAAATTAAA TAAAGGGTAT 9120 

50 

GCGTATGTAC AATTCAAATT AATCGAAGGA TGAAATAAAA TGACTAATCA ATTTAAAAAT 9180 

AAACAGTCCA AATTACATGA CAGTTTAGAA TCCATCACAA AAAACTTATA TGCGACACCT 924 0 
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ACAGAATATT GTTATCTATC ATTCCGGACA CTTAGGTOAC TCCCAACAAG ACATTGCATC 9360 
ATTAGGTGGT GTTTCAAAAG TATTGATGAA TCATGATCAT GAATCTATAG GAGGTTCTAA 9420 
TCAAGTTGAA GCCCCTTACT TTATACATGA AAATGATGTG GCTGCACTGA AACATAAGAT 94 BO 

TTCTGTTCAA AAACAATTTA GTAATCGTGT AATGTTGGAT AAGGATTTAG AAGTTATTCC 9540 
CGCGCCTGGA CATACACCAG GGACGACACT ATTTTTATGG GATGATGGTC ATCACCGTTA 9600 
CTTATTTACT GGAGATTTTA TATGTTTTGA AGGGAAGAGA TGGCGTACAG TTATATTAGG 9660 
TTCAAGTGAT AGAGAAAAAT CTATTCAAAG TTTAGAGATG GTTAAAGAAT TAGATTTTGA 9720 
TGTACTTGTA CCTTGGGTTA CTATCAAAGA TGAACCGTTA GTTTATTTTG TAGAAAATGA 9700 
ATATGAAAAA CGTGAACAAA TACAAAATAT TATTGATAGA GTACGTGAGG GCGAGAATAG 9840 
CTAATTGAAA TATATTGGCG AAgCAATGTA ACGAATCTAA GAAAGCCCTA GAAAATACCT 9900 
CCATAATTGA TTGTCATATA AAACAAAAAC GGTAATTTCT ATTTATTGAG ATAGAAATTA 9960 

CCGTTTATTT CGTGGACCTA TTGCATTGTT TTTATCATGC ATAATCATCA TTGTCGTT G T 10020 

TTGAGTCAAT TTTAATTTTC AGAATCAGAA GGCTGTTCTG GAATTGGGAA ATATTTGAAA 10080 

ATTTCACCGC TTTCAATCGC TTCGGTTAAC TGTTCTAACC ATTCGTAATA AACATGTGTA 10140 

TGATCAAGCT GAGCTTTAAT TTTTTGTGCC TCTTGTGTTT CAGCTTCAGT TAAATCACTG 10200 

CTTTCAAGTA ATGGATTGAT AATAGCTTGA GCATCTTTTA CTGCTTCGAC ATTGATGTCA 10260 

ATTTCACGCT GGAATTTTTT AGTGAAAAAG TTTCGGAAAA AGATGAAAAA GTCTTTCTCG 1032 0 

GCGATAAAAT GTTGTTTGCG GCTTCCTCTC GTAAATTGTT GTTTAACAAT ATCAAATTCC 10380 

TGCAATTTCT TAACGCCAGC ACTCATACTT GGTTTGCTCA TTTGCAATTG ATGACGCATT 1044 0 

TCATCAAGCG TCATACTGCC TTCAAACACC ATTGTGCCAT ATAAGTTTCC TACACTTCTA 10500 

TTAGTGCCAT ACAAATCCAT TGTCTGTCCA ATTGAATTAA TTACAATATC TTTTGCTTGT 10560 

TCTAATTGTT GCTGTTTGTT CTGAGAACGA GTCATCATTG CACCTCCGTA CATCATTTTG 10620 

GTCACGTTAA AATAAATACT AATACATTAT AAAACCTTTT CTAAAAAAAG ACATTAAAAA 10680 

TATTTAAAGC ATTAAAGTTA AATGTTTCGT TAAATAAAAA TCTAACGAAC TTACAAAACT 10740 

TAATTCTTGA GTTGTTTTGT AAATTGACAC ATTTTTCATT TCTATG CTAA CATAAGTnTG 10800 

TAAAATTcGT TAAATAAAAA TTTAACAAAC TTAACGGrGG TTGTTGAAkG GrACTTTTAA 10860 

aACATTTATC TGAGCGTCAA TATATTGATG GTGAGTGGGT TGAAAGCGCG AATAAAAATA 10920 

CAAGAGATAT TATCAATCCT TACAATCAAG AAGTGATATT TACGGTTTCT GAAGGGACAA 10980 

AAGAGGATGC AGAACGTGCA ATCTTAGCTG CAAGACGTGC GTTTGAGTCT GGTGAATGGT 11040 
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AACATCgCGA AgCgTTAGCA CGATTAGAAA CATTAGATAC TGGAAAAACG TTAGAAGAAT 11160 

CATATGCAGA TATGGATGAT ATTCATAATG TGTTTATGTA TTTTGCTGGA TTAGCAGATA 11220 

5 

AAGACGGTGG CGAAATGATT GATTCACCAA TTCCAGATAC AGAAAGCAAA ATTGTTAAAG 11280 

AACCAGTAGG TGTAGTTACA CAAATTACAC CTTGGAATTA TCCGTTATTA CAAGCATCAT 11340 

GGAAAATTGC GCCAGCGCTT GCTACGGGTT GTTCACTAGT TATGAAACCA AGTGAAATTA 11400 

10 

CACCATTAAC AACAATACGT GTTTTTGAAT TAATGGAAGA AGTTGGTTTC CCTAAAGGAA 1146 0 

CAATTAATCT TATTCTAGGT GCAGGTTCTG AAGTTGGTGA CGTAATGTCA GGTCATAAAG 11520 

1S AGGTTGACCT TGTATCATTT ACAGGTGGCA TTGAGACTGG TAAGCATATT ATGAAAAATG 11580 

CTGCTAATAA TGTTACGAAT ATTGCCTTGG AACTTGGCGG TAAAAATCCA AACATTATCT 11640 

TTGATGATGC TGATTTTGAA TTGGCAGTAG ACCAAGCGTT AAATGGTGGA TATTTCCATG 11700 

20 CAGGTCAAGT TTGTTCAGCA GGATCAAGAA TATTAGTACA AAACAGTATT AAAGACAAAT 11760 

TTGAGCAAGC ACTTATTGAT CGCGTGAAAA AAATCAAATT AGGTAATGGT TTTGATGCTG 11820 

ATACTGAAAT GGGACCAGTG ATTTCAACAG AACATCGTAA TAAGATCGAA TCTTATATGG 11880 

25 ATGTAGCTAA AGCAGAAGGC GCAACAATTG CTGTTGGTGG TAAACGTCCA GATAGAGATG 11940 

ATTTAAAAGA TGGTCT ATT C TTCGAGCCAA CAGTCATTAC AAATTGTGAT ACGTCAATGC 12000 

GTATTGTACA AGAAGAGGTT TTCGGACCTG TCGTTACTGT AGAAGGCTTT GAAACTGAAC 12060 

30 

AAGAAG CGAT TCAATTAGCG AATGATTCTA TATATGGTTT AGCAGGTGCT GTATTTTCTA 12120 

AAGATATTGG AAAAGCACAA CGCGTTGCTA ACAAGTTGAA AGTTGGAACG GTGTGGATTA 12180 

ATGATTTCCA T C CAT ATTTT GCACAAGCGC CATGGGGTGG ATACAAACAA TCAGGTATCG 12240 

35 

GTAGAGAATT AGGCAAAGAA GGCTTAGAAG AGTACCTTGT TTCAAAACAC ATTTTAACAA 123 00 

ATACAAATCC ACAATTAGTG AATTGGTTTA GCAAATAAAA ATTAGATAAG GTGAGTGCCA 123 60 

40 TTGTAAGAAC ACAAGACACT CACTTTGTTT TGTATAAGTG GCGAAATGTT GATTGATAAT 12420 

TTGGACTAAA CGCAAAATGA ATCATAGATT ATTTCATTAC TGTTAGTAAC AATCGTAAAA 12480 

GGAAAAGCGA GTGTTTTGGT TAGCTAAGTT TAGCAATTCA ACGATAACCA ATCAGCCACT 1254 0 

45 AACAAATATT TCATGCAATA CTCACTTTGA AATACAACAA ACTTTGGAGG TCATAACGAT 12600 

GAGTAACAAA AACAAATCAT ATGATTATGT CATCATTGGA GGAGGCAGTG CAGGTTCTGT 12660 

ACTAGGTAAT CGTCTGAGTG AAGATAAAGA TAAAGAAGTC TTAGTATTAG AAGCGGGTCG 12720 

60 

CAGTGATTAT TTTTGGGATT TATTTATCCA AATGCCTGCT GCGTTAATGT TCCCTTCAGG 12780 

CAATAAATTT TACGATTGGA TTTATTCAAC AGATGAAGAA CCACATATGG GCGGTCGTAA 12840 
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w 



is 



20 



25 



TCAACGTGGT AATCCAATGG ACTATGAAGG CTGGGCAGAA 
GGATTTTGCG CACTGTTTAC CGTATTTTAA AAAATTAGAA 
TTATGATAAA TTTAGAGGCC ATGATGGACC AATTAAGTTA 
TCCTTTATTC CAGTCATTCT TTGATGCAGG TGTTGAAGCA 
TGTGAATGGA TTTAGACAAG AAGGTTTTGG ACCGTTCGAT 
CCGAATGTCA GCTTCAAGAG CATATTTACA TCCAGCGATG 
TGAAACACGT GCCTTTGTAA CTGAAATTCA TTATGAAGGT 
GTATAAGAAA AATGGCAAAC TACATACCAT CGATGCTAAT 
GGCATTCAAT ACGCCACAAT TACTACAATT ATCTGGTATC 
ATCAAAAGGC ATTGAGCCAC GTGTTCATTT ACCTGGTGTG 
CTTAGAGG 

(2) INFORMATION FOR SEQ ID NO: 121: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7646 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



CCAGAAGGTA TGGAAACTTG 12960 

AAAACATACG GTGCAGCGCC 13020 

AAACGAGGGC CAGCAACGAA 13080 

GGCTATCATA AAACACCTGA 13140 

AGTCAAGTAC ATCGTGGTCG 13200 

AAGOGTAAAA ACTTAACCGT 13260 

AGAAGAGCAA CTGGTGTTAC 13320 

GAAGTCATTT TGTCTGOTGG 13380 

GGTGATTCAG AGTTCCTAAA 13440 

GGTGAAAACT TTOAAGATCA 13500 

13508 



30 



35 



40 



45 



SO 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 121: 

GTAAGTATTG TCTTGATTTC CTAATAAAGT TATATCTTGT AATTCATCTT GTTGACGGCC 60 

ATGTGCCATA TAAAGCGCTC CTTTAAATTT ATTTTTTTAT TATTTTGGCG TCTCGGCGTG 120 

- CTTTTTCAAA CATGTAATAA CTTGCACCGA TAATAACGAC GTAACCTAAT GTTGCATAGA 180 

AATCfTGGAGA TTCTCCGAAT AGAATAAATC CAAGTATTGC TGTGAAAATT ATAGATGCAT 240 

ACGTAAAAAT AGAAATATCT TTTGCTGCTG CAAAACTATA TGCTAAAGTA ACACCAATTT 300 

GACCCACAGC GGCAgCTAAG CCAGCCCCTA ATAGATAAAG TATTTGCATC TGACTCATTG 360 

GTTCATAAGT ATATGCAGTG AAAGGTATTA AAACGATGAC AGAAAATAAG GAGAAGTAAA 420 

ATACTATAGT ATATGGTGCT TyTCTTGTAC TAAGTGCTCG AACACATGTA TATGCTGATG 480 

CTGCAAAAAT ACCTGAGAAT AAGCCAGCTA ATGATGGAAT CATAGATGAT GAAAATTCAG 540 

GTTTCACTAT TAAnAGCAaC CTAAAATAGC AATTATCATT GCTGTAATTT GaTACTTCCT 600 

TACCTTTTCA TGtAAGAaaA CAATGCTTaA TAAAATCGTC CAGAAAGGAT TGAGTTTCAT 660 

TAATGAATCG GCATCACTAA GTACCATATG ATCAATGGCA TAAATATTTA ACAATACACC 720 
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TGGCTGATGG TATTTATATA TAAAAAATAA TGGAATAAAC ATTGCTACTA AGTTTCGTOC 840 

TAATGATTTT TGAAAAACAG GAAGGTCACC TGCAAGTCTG AAAAACACTG ACATAAAACT 900 

5 

GAAACCAATA GCCGAAATTA AAATGGCAAT GATACCTTTT ACTTTAGGAT TCAATTTTAT 960 

CGCCTCTTTT ATATAAAATT AACGTATTTA TATTAGCATA AAACAACATG TTGTGCATAA 1020 

ATAGTTGAAA TTTACTATAA AAAGACTATA ATAGACTGTA GCGAACAAAC GTTCTGTGTT 1080 

10 

TATTTGTCGG AATAATAGGG CATTACACTT TTATGAATGT TTGTGTTATT ACATAAAACA 1140 

AATATCAATT CAGTATCAAG CTAATAAGCT TTTTCTTGAT TTCTGTTGAT ACAATTGAGA 1200 

r5 TTGACACAGA TTTAAAAAAA TCAAGTGATA TCTACTAAAA AATTTTTTTA AATTTGTTCA 1260 

AGTTTTTCTA ATTTAGTATT GGTGCCTAGT TGGAACGTTT TACGAACATT CGATTAGAAA 1320 

ATGGCACTTT AAATCATAGT GTGTCTTATG TATAATGAAA CACATAATAT AGTGTTGGTG 1380 

20 AAACGAAAAA gACACAATAT CTTGTGTTTT GTATGCAAAT GCTTTATTTA TGAAGAAATT 144 0 

ACATTTAAAA GTAATTTAAC ACAGAAATTT AATAGTTATT ATCAATTAAT AGTCATATTT 1500 

TTAGAAAATG TACTGAGCAA ATGGAAGATA TCCAATGATG TAAACACTAC ATATAGTGAT 1560 

25 

TTTTATACAT TCAACCCATA TAAGCTACTA TTTTCTCAAA TATAAATCTA TGCAATTGGT 162 0 

TTACATTTGA GAAAATAAGT AGCTTCATTA TAGTTAATAC AATGCTGAGA TAACCATAGT 16 80 

AACCATGTTG TTAAAGCATT TTTTAATTGG AATGACTACT TTATTTAAAA GGGTTGAAGA 174 0 

30 

AAGAAGGTGA TCCAATGAAA ATAATATATT TTTCATTTAC TGGAAATGTC CGTCGTTTTA 1800 

TTAAGAGAAC AGAACTTGAA AATACGCTTG AGATTACAGC AGAAAATTGT ATGGAACCAG 1860 

TTCATGAACC GTTTATTATC GTTACTGGCA CTATTGGATT TGGAGAAGTA CCAGAACCCG 192 0 

35 

TTCAATCTTT TTTAGAAGTT AATCATCAAT ACATCAGAGG TGTGGCAGCT AGCGGTAATC 1980 

GAAMTGGGG ACTAAATTTC GCAAAAGCGG GTCGCACGAT ATCAGAAGAG TATAATGTCC 204 0 

40 CTTTATTAAT GAAGTTTGAG TTACATGGAA AAAACAAAGA CGTTATTGAA TTTAAGAACA 2100 

AGGTGGGTAA TTTTAATGAA AACCATGGAA GAGAAAAAGT ACAATCATAT TGAATTAAAT 2160 

AATGAGGTCA CTAAACGAaG AGAAGATGGA TTCTTTAGTT TAGAAAAAGA CCAAGAAGCT 2220 

45 TTAGTAGCTT ATTTAGAAGA AGTAAAAGAC AAAACAATCT TCTTCGACAC TGAAATCGAG 2280 

CGTTTACGTT ATTTAGTAGA CAACGATTTT TATTTCAATG TGTTTGATAT TTATAGTGAA 2340 

GCGGATCTAA TTGAAATCAC TGATTATGCA AAATCAATCC CGTTTAATTT TGCAAGTTAT 2400 

60 

ATGTCAGCTA GTAAATTTTT CAAAGATTAC GCTTTGAAAA CAAATGATAA AAGTCAATAC 2460 

TTAGAAGACT ATAATCAACA CGTTGCCATT GTTGCTTTAT ACCTAGCAAA TGGTAATAAA 2520 
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ACATTTTTAA ACGCAGGCCG TGCGCGTCGT GGTGAGCTAG TGTCATOTTT CTTATTAGAA 2640 

GTGGATGACA GCTTAAATTC AATTAACTTT ATTGATTCAA CTGCAAAACA ATTAAGTAAA 2700 

5 

ATTGGGGGCG GCGTTGCAAT TAACTTATCT AAATTGCGTG CACGTGGTGA AGCAATTAAA 2760 

GGAATTAAAG GCGTAgCGAA AGGCGTTTTA CCTATTGCTA AOTCACTTGA AGGTGGCTTT 2820 

AGCTATGCAG ATCAACTTGG TCAACGCCCT GGTGCTGGTG CTGTGTACTT AAATATCTTC 2880 

70 

CATTATGATG TAGAAGAATT TTTAGATACT AAAAAAGTAA ATGCGGATGA AGATTTACGT 2 940 

TTATCTACAA TATCAACTGG TTTAATTGTT CCATCTAAAT TCTTCGATTT AGCTAAAGAA 3000 

1S GGTAAGGACT TTTATATGTT TGCACCTCAT ACAGTTAAAG AAGAATATGG TGTGACATTA 3060 

GACGATATCG ATTTAGAAAA ATATTATGAT GACATGGTTG CAAACCCAAA TGTTGAGAAA 3120 

AAGAAAAAGA ATGCGCGTGA AATGTTGAAT TTAATTGCGC AAACACAATT ACAATCAGGT 3180 

20 TATCCATATT TAATGTTTAA AGATAATGCT AACAGAGTGC ATCCGAATTC AAACATTGGA 3240 

CAAATTAAAA TGAGTAACTT ATGTACGGAA ATTTTCCAAC TACAAGAAAC TTCAATTATT 3300 

AATGACTATG GTATTGAAGA CGAAATTAAA CGTGATATTT CTTGTAACTT GGGCTCATTA 3360 

26 AATATTGTTA ATGTAATGGA AAGCGGAAAA TTCAGAGATT CAGTTCACTC TGGTATGGAC 3420 

GCATTAACTG TTGTGAGTGA TGTAGCAAAT ATTCAAAATG CACCAGGAGT TAGAAAAGCT 3480 

AACAGTGAAT TACATTCAGT TGGTCTTGGT GTGATGAATT TACACGGTTA CCTAGCAAAA 3540 

30 

AATAAAATTG GTTATGAGTC AGAAGAAGCA AAAGATTTTG CAAATATCTT CTTTATGATG 3600 

ATGAATTTCT ACTCAATCGA ACGTTCAATG GAAATCGCTA AAGAGCGTGG TATCAAATAT 3660 

CAAGACTTTG AAAAGTCTGA TTATGCTAAT GGCAAATATT TCGAGTTCTA TACAACTCAA 3720 

3S 

GAATTTGAAC CTCAATTCGA AAAAGTACGT GAATTATTOG ATGGTATGGC TATTCCTACT 3780 

TCTOAGGATT GGAAGAAACT ACAACAAGAT GTTGAACAAT ATGGTTTATA TCATGCATAT 384 0 

40 AGAtTAGCAA TTGCTCCAAC ACAAAGTATT TCTTATGTTC AAAATGCAAC AAGTTCTGTA 3900 

ATGCCAATCG TTGACCAAAT TGAACGTCGT ACTTATGGTA ATGCGGAAAC ATTTT AC CCT 3960 

ATGCCATTCT TATCACCACA AACAATGTGG TACTACAAAT CAGCATTCAA TACTGATCAG 4020 

45 ATGAAATTAA TCGATTTAAT TGCGACAATT CAAACGCATA TTGACCAAGG TATCTCAACG 4080 

ATCCTTTATG TTAATTCTGA AATTTCTACA CGTGAGTTAG CAAGATTATA TGTATATGCG 4140 

CACTATAAAG GATTAAAATC ACTTTACTAT ACTAGAAATA AATTATTAAG TGTAGAAGAA 4200 

50 

. TGTACAAGTT GTTCTATCTA ACAATTAAAT GTTGAAAATG ACAAACAGCT AATCATCTGG 4260 

TCTGAATTAG CAGATGATTA GACTGCTATG TCTGTATTTG TCAATTATTG AGTAACATTA 4320 
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ATOTTTTGGA GACAAAATAT ATCTCAAATG TGGGTTGAAA CAGAATTTAA AGTATCAAAA 4440 

GACATTGCAA GTTGGAAGAC TTTATCTGAA GCTGAACAAG ACACATTTAA AAAAGCATTA 4500 

s 

GCTGGTTTAA CAGGCTTAGA TACACATCAA GCAGATGATG GCATGCCTTT AGTTATGCTA 4560 

CATACGACTG ACTTAAGGAA AAAAGCAGTT TATTCATTTA TGGCGATGAT GGAGCAAATA 4620 

CACGCGAAAA GCTATTCACA TATTTTCACA ACACTATTAC CATCTAGTGA AaCAAACTAC 4680 

10 

CTATTAGATG AATGGGTTTT AGAGGAACCC CATTTAAAAT ATAAATCTGA TAAAATTGTT 4740 

GCTAATTATC ACAAACTTTG GGGTAAAGAA GCTTCGATAT ACGACCAATA TATGGCCAGA 4800 

15 GTTACGAGTG TATTTTTAGA AACATTCTTA TTCTTCTCAG GTTTCTATTA TCCACTATAT 4 860 

CTTGCTGGTC AAGGGAAAAT GACGACATCA GGTGAAATCA TTCGTAAAAT TCTTTTAGAT 4920 

GAATCTATTC ATGGTGTATT TACCGGTTTA GATGCACAGC ATTTACGAAA TGAACTATCT 4 980 

20 GAAAGTGAGA AACAAAAAGC AGATCAAGAA ATGTATAAAT TGCTAAATGA CTTGTATTTA 5040 

AATGAAGAGT CATACACAAA AATGTTATAC GATGATCTTG GAATCACTGA AGATGTGCTA 5100 

AACTATGTTA AATATAATGG AAACAAAGCA CTTTCAAACT TAGGCTTTGa ACCTTATTTT 5160 

26 GAGGAACGTG AATTTAACCC AATCATTGAG AATG CCTTAG ATACAACAAC TAAAAACCAT 5220 

GACTTCTTCT CAGTAAAAGG TGATGGTTAT GT ATT AG CAT TAAACGTAGA AGCATTACAA 5280 

GATGATGACT TTGTATTTGA CAACAAATAA CAATTAAATT AAAAGACCTT CACATGTAAA 534 0 

30 

GGGAAATAGC GATTCGTTTC GTCTTGTCTC CTACATGTTG AAGGTCTTTT TTTATGTGTA 5400 

TCTAACTCAT TATGAGTCTG AGTAAGAAAT CAATGCTCTA AGATGTACAA TGCTATTTAT 5460 

ATTGG GAG T A GTTGGCGGGG CCCCAACACA GAAGCAGGOG GAAAGTCAGC TAACAATATT 5520 

3S 

GTGCAAGTTG GCGGGGCCCC AACATAGAAG CAGGCGGAAA GTCAGCTAAC AATAATGTGC 5580 

AAGTTGGCGG GGCCCCAACA TAAAAGCAGG CGGAAAGTCA GCTAACAATA TTGTGCAAGT 564 0 

40 TCGGgCGGGG CCCCAACATA AAGAAAAACT TTTTCCTTTA G AAATT AT CA CTTCCaCaTG 5700 

AGTTTTACTC ATGTATTCCT ATTTTTAAGT ACACATTAGC TGAGGCTAAT GTTAAGAACC 5760 

ACTACTTAAT CAATCATTAG TAGTTTTTAT CATTTCCACT ATTCCCaGAC ATCaAAATCT 5820 

45 TAAGTGTTCT ATTTTACTTT AAGTAAACAA AATACACATT CCGAAAAATT AAATTTCAGT 5880 

TTAATTGCAA ATATCAATAA AATTGACACT AAATTATTTG AAAGGCTATT GAAATTATGG 5 940 

TCAAAAAACG CTACTATTAA TGAGAAATAT TATCAATGAT AATGATTATC ATTAATTTAA 6000 

60 

AGGGAGAAAA ATTTGTAATG AAGTATTTAT TAAAGGGAAA TATTTTGCTT CTATTACTAA 6060 

TATTGTTGAC AATTATTTCG TTG TT CAT AG GTGTGAGTGA ACTATCAATT AAAGATTTAC 6120 
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10 



GTATTTTAAT TGCTGGAAGT TCOTTGQCTT TAGCAGGCTT GATAATGCAA CAAATGATGC 6240 

AAAATAAGTT TGTTAGTCCG ACTACAGCTG GAAOGATGGA ATGGGCTAAA CTAGGTATTT 6300 

TAATTGCTTT ATTGTTCTTT CCAACCGGTC ATATTTTATT AAAACTAGTA TTTGCTGTTA 6360 

TTTGCAGTAT TTGCGGTACG TTTTTATTTG TTAAAATCAT TGATTTTATA AAAGTGAAAG 6420 

ATGTCATTTT TGTACCGCTT TTAGGAATTA TGATGGGTGG GATTGTTGCA AGTTcACAAC 6480 

CTTCATCTCA TTGCGCACGA ATGCTGTTCA AAGCATTGGT AACTGGCTTA ACGGGAACTT 6540 

TGCCATTATC ACAAGTGGAC GCTATGAAAT TTTATATTTA AGTATTCCTC TTTTAGCATT 6600 

/5 GACATATCTT TTTGCTAATC ATTTCAOGAT TGTAGGAATG GGTAAAGACT TTACTAATAA 6660 

TTTAGGTTTG AGTTACGAAA AATTAATTAA CATCGCATTG TTTATTACTG CAACTATTAC 6720 

AGCATTGGTA GTGGTGACTG TTGGAACATT ACCGTTCTTA GGACTAGTAA TACCAAATAT 6780 

20 TATTTCAATT TATCGAGGTG ATCATTTGAA AAATGCTATC CCTCATACGA TGATGTTAGG 6840 

TGCCATCTTT GTATTATTTT CTGATATAGT TGGCAGAATT GTTGTTTATC CATATGAAAT 6900 

AAATATTGGT TTAACAATAG GTGTATTTGG AACAATCATT TTCCTTATCT TGCTTATGAA 6960 

AGGTAGGAAA AATTATGCGC aACAATAATA AAAAAATAAT GCTTTTAATT GCAGTAACGT 7020 

TATTAATTAG TATGCTGTAC TTATTTGTAG GTATTGATTT TGAAATATTT GAATATCAAT 7080 

TTTCAAGTCG TTTAAGAAAG TTCATATTAA TTATTTTAGT AGGTOCTGCC ATTGCAACTT 7140 

CAGTGGTGAT TTTTCAAGCG ATTACAAATA ACCGTCTATT GACACCATCA ATAATGGGGT 7200 

TAGATGCAGT TTATTTATTT ATCAAAGTAT TGCCAGTCTT TTTATTTGGA ATTCAATCGG 7260 

TATGGGTTAC TAATGTATAT TTGAACTTTA TATTAACACT TATAACGATG GTGTTATTCG 7320 

35 

CACTAATCCT ATTCCAAGGT ATCTTTAAAA TCGGACATTT TTCAATTTAT TTTATCTTAC 7380 

TTAJTGGTGT CCTTTTAGGA ACATTTTTTA GAAGCATAAC AGGTTTTATT CAACTGATTA 7440 

40 TGGATCCTGA GTCATTTTTA GCAATACAAA GTAGTATGTT TGCTAATTTT AATGCTTCTA 7500 

ATTCGAATTT AGTTACTTTC TCAGCAGTGC TATTAGTAAT CTTATTAGTC ATTACAATTT 7560 

T ACT ATTG C C TTATTTAGAT GTATTGCTTT TAGGTCGTGC TGAAGCAATT AATCTTGGGA 7620 

45 TATCGTATGA AAAATTAACG CGAATT 764 6 

(2) INFORMATION FOR SEQ ID NO: 122: 

(i) SEQUENCE CHARACTERISTICS: 
SO (A) LENGTH: 1194 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

55 



26 



30 



683 



EP0 786 519 A2 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 122: 



6 



10 



15 



30 



35 



ATCAATATAT 


TTnnAAATAA 


ATTATTATGG 


ATTGCACCAA 


TnGCCACTAT 


GATTATCTTG 


€0 


GTAATCTTTT 


CTTTAGCTTT 


TTATCCTGCA 


TATAATCCTA 


AACCAAAAGA 


TTTACCAATT 


120 


GGTATATTAA 


ACGAGGATAA 


AGGTACAACG 


ATTCAAGATA 


AAAATGTTAA 


CATTGGTAAA 


180 


AAATTAGAGG 


ATAAATTATT 


AGATAGTGAT 


TCTAATAAAA 


TTAAATGGGT 


TAAGGTTGAT 


240 


AQTGAAAAAG 


ACCTTGAAAA 


AGATTTGAAA 


GATCAAAAAA 


TCTTTGGAGT 


AGCTATTATT 


300 


GATAAAGACT 


TTTCAAAAGA 


TGCTATGAGT 


AAAACACAAA 


AAGTAGTTAT 


GGATAGTAAA 


360 


AAAGAAGAAA 


TGCAACAAAA 


AGTTGCTTCA 


GGTGAAATTC 


CGCCACAAGT 


GGTTCAACAA 


420 


ATGAAACAAA 


AAATGGGGAA 


TCAACAAGTA 


GAGGTTAAGC 


AGGCTAAATT 


TAAAACGATT 


480 


GTAAGTGAAG 


GATCAAGCTT 


ACAAGGTTCA 


CAAATTGCAT 


CAGCTGTGTT 


AACTGGTATG 


540 


GGTGATAATA 


TTAATGCTCA 


AATTACGAAG 


CAAAGTTTGG 


AAACATTAAC 


GAGTCAAAAT 


€00 


GTTAAAGTCA 


ATGCCGCGGA 


CATCAATGGT 


TTGACGAATC 


CAGTAAAAGT 


GGATAATGAA 


660 


AAACTTAATA 


AAGTTAAAGA 


TCACCAAGCA 


GGTGGTAATG 


CACCATTCCT 


AATGTTTATG 


720 


CCAATTTGGA 


TAGGTTCAAT 


CGTAACGTCT 


ATCTTATTGT 


TCTTTGCATT 


TAGAACTAGT 


780 


AACAATATCG 


TCGTGCAACA 


TCGTATCaTT 


GCtTCAATTG 


GACAGATGAT 


ATTTGCAGTT 


840 


GTTGCAGCAT 


TTGCAGGTAG 


CTTTGTTTAT 


ATTTATTTCA 


TGCAAGGCGT 


TCAAAGATTT 


900 


GATTTTGACC 


ATCCAAATCG 


TATCGCAATT 


TTTGTAGCAT 


TTGCGATTCT 


TGGTTTCGTG 


960 


GGCCTTATTT 


TAGGTGTTAT 


GGTATGGCTA 


GGTATGAAGT 


CAGTTCCAAT 


TTTCTTCATT 


1020 


TTAATGTTCT 


TTAGTATGCA 


ACTTGTAACG 


TT AC CT AAA C 


AAATGTTGCC 


TGAAAGTTAT 


1080 


CAAAAATATG 


TATATGATTG 


GAATC CATTC 


ACACACTATG 


CAACAAGTGT 


AAGAGAC TAT 


1140 


TATAClTGAA 


TCATCATATT 


GAATTAAATA 


GTACAATGTG 


GATGTTTATA 


GGGT 


1194 



40 (2) INFORMATION FOR SEQ ID NO: 123: 

<i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 558 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 

45 (D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 123: 

50 

GACCGACCTA TACATCCGTA TAAGTATTTC TTGATATAAG TCTTCTAAAT CATAATGATT 60 
AAATCCAAAT GTTTTGATGC GTCGAATAAT TAATGGTTGT AGATCCATTA CTAACTTTTC 120 
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GTATTTCAAA TATTAAACTA ACCCCTTCTA TCTAAAATTT AAGGTTAGTT TAATATTGTT 240 
ACATTCAAAA TTTCAAGATG ACGGAAATGT CATTTCTTAT GATGTCCTCT TCGTATTTTT 300 
5 TCAAATTCTG CAAGGATTTC AGAAGATAAC GGAATTCGAG T TC TTGGCTT GTTTTCACTT 360 

ATATCATCTA ATGATTTACT CACATCAATT TCATTTTCTT TTAAATCTCT CCACATTTCG 420 
CGAGATGATA TTCTATATGC ACCTGATCCA AAGATAGCAT GTTGcTCACT CaTATCACTT 4 80 

10 

G TTACAACTG TAATATGcTT AGtATGCTTG tCaTAAAGtT CaTAAACCAT AACGGTTCTA 540 
ATGGAAACCA ATCAGCTG 558 
(2) INFORMATION FOR SEQ ID NO: 124: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7762 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
20 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 124: 



25 


GCTTCAGACA 


TnTGATGATA 


TAATCTCTCA 


TCATCGATTA 


ATTCTTTTGC 


AGCTTGATAC 


60 




ACATnTTGCT 


TATTTGTTCC 


AATGACTTTT 


AATGTGCCAG 


CTTCAACACC 


TTCAGGACGT 


120 




TCTGTAACAC 


TTCGCCAAAA 


CTAAAACTGG 


CTTATTAAAT 


GATGGCGCTT 


CTTCCTGAAT 


180 


30 


TCCACCTGAA 


TCTGTCAAAA 


TAAAATAAGA 


TTTTnTAGCA 


AAATTATGGA 


AATCTATACG 


240 




TCCAAAGGTT 


CAATCAATTC 


AATTCTGTCA 


TG ACT AC CT A 


AAATCTTTTG 


AGCCACCTCT 


300 


35 


OGAACTTTCG 


GGTTTTTATG 


CATTGGATAT 


ACCAGTGCTA 


AATCAGTATA 


CTCAT CTATT 


360 


AAGCGTCTAA 


CCGCTTTAAA 


TATATTTTCC 


aTGGGTTTCC CGATATTTTC TCGTOGGTGT 


420 




GCTGTCATrA 


GAATGAATTT 


kTtGTCATGG 


TATTTATCCA 


TGATGTTAGA 


TTTATAATTG 


480 


40 


TCATCAACTG 


TATATTTCAT 


AGCATCAATC 


GCAGTATTAC 


CAGTGACAAC 


AACACTTTCT 


540 


GAATATTTCC 


CTTCACTTAA 


CAAATGCGAT 


GCAGCATTTT 


TAGTAGGTGC 


AAAATGTAAG 


600 




TCAGCTAATA 


CACCAACTAA 


TTGTCTATTC 


ACCTCTTCTG 


GAAAAGGTGA 


ATATTTATCA 


660 


45 


TAACTTCTAA 


GCCCTGCTTC 


AACGTGTCCA 


ATCGGCACTT 


GGTTATAAAA 


TGCCGCTAAA 


720 




CCACCTGCAA 


ATGTCGTCAT 


CGTATCACCA 


TGTACAAGTA 


CCATGTCTGG 


TTTTTCTAAT 


780 




TGAATCACTT 


GTTCTAATTG 


AGTGATTGAT 


TTAGAAGTTA 


TCTCAGAAAG 


TGTCTGTCCT 


840 


SO 


GATTTCATAA 


TATTCAAATC 


GTATTTTGGT 


TTGATTTCAA 


AGGTACTTAA 


TACTGAATCA 


900 




AGCATTTCTC 


TATGCTGTGC 


TGTAACAACA 


ACAATTGGCT 


CGAGCATTTT 


TTCTTGTTCC 


960 
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ATCTTTTTCA TCAAACTACT TATCTCCGAT TCTTCTATTT AGTACCAAAC AATCTATCTC 1080 

CAGCGTCGCC TAACCCTGGT GTGATATATG CTTTGTCATT aGCTTTTCAT CAAGTGCAGC 1140 

AATATAAATA TCTACATCTG GATGTGCTTC ATGCATCTTT TCTACGCCTT CTGGTGCTGC 1200 

AATTAAACAC ATGAAGCGAA TATTTTTAGC GCCACGTTTC TTCAATGAAG TAATAGCTTC 1260 

AATTGCTGAT GCGCCTGTTG CTAACATAGG ATCAACAACA ATGATTTGTC TTTCAGTAAT 1320 

ATCTTGAGGT AACTTAGCAA AATACTCTAC AGCCTTTAAT GTTTCGGGAT CTCGATATAA 1380 

ACCGATATGT CCAACTCTGG CTGCAGGTAC TAAACTTAAA ATACCATCAG TCATACCTAA 1440 

ACCAGCTCTT AAAATTGGAA CGATAGCTAA TT T TTTACCA GCTAATCGTT TAGCCGTCAT 1500 

TTTAGTTACA GGCGTTTCAA TATCAACATC CTGAAGCTCT AAGTCTCTAG TTACTTCATA 1560 

TGCCATCAAC ATACCAACTT CGTCTACAAG TTCTCTAAAT TCTTTAGTAC CTGTATTTAC 1620 

ATCTCTAATA TAGCTTAGTT TGTGTTGAAT TAATGGATGA TCGAAAACGT GTACTTTACT 1680 

20 

CATAAAAATT ACTCCTATCT TTGTGTATGT TTATTGATAT AGAGGATATT CAGCTGTTAA 1740 

TTTCGCAACG CGTTCTTTAG CTTGTTGTAA TTTTTCTTCA TCTTTACTAT TTTTCAATGC 1800 

25 TAAACTGATG ATTTTTGCAA CTTCCTCAAA AGCTTTTTCA TCAAATCCAC GCGTTGTTGC 1860 

AGCAGGTGTA CCTAAACGTA TACCACTCGT TACAAAAGGT TTTTCTTGAT CGAACGGAAT 1920 

GGTATTTTTG TTACATGTGA TACCAACTGA ATCTAAAGTC TCTTCAGCTT CTTTACCAGT 1980 

30 AAGTCGTATA G AC CCTTTTA CATCAACAGC TACTAAGTGA TTATCTGTAC CGCCAGAAAC 204 0 

AATTCTAAAT CCTTCATTAA TTAATGCTTC TGCAAGAACT TTTGCGTTTT TAACCACTTG 2100 

TTGTTGATAC GTTTTGAAAT TATTTTCTAA CGCTTCTCCA AAAGCAACTG CTTTtGCTgC 2160 

AATAAGATGC tcaagaggtc caccttgaat accagggaaa ATTGTTTTAT CTATGTCTTT 2220 

TTTATATTCT TCCTTACATA AAATCATACC ACCACGtGGT CCG CGTAATG TTTTGTGTGT 22 80 

TGTAGTTGTT ACAAAATCAG CATATTCTAC TGGATTTGGA TGTAAACCTG CCGCTACTAA 2340 

TCCTG CAATA TGTGCCATGT CTACCATTAA CTTAGCGTTT ACTTCATCTG CGATTTCTTT 24 00 

AAACTTTTTG AAGTCAATTG TTCTTGAATA TGCTGATGCT CCTGCCACAA TAAGCTTAGG 24 60 

CTTATGCTCT AACGCTAATT TACGAACTTC ATCATAATTG ATTCGTTCTG TGTCTTTATC 2520 

TACTCCATAT TCAACGAAAT TGTAGAATTT ACCACTAAAA TTAACAGGCG CTCCATGTGT 2580 

CAAGTGACCA CCATGACTCA AATTCATACC TAAAACTGTG TCGCCCATTT CTAATGCAAC 2640 

SO TAAGTAAACA GCCATGTTCG CTTGTGAACC TGAATGTGGT TGAACATTGA CATGTTCAGC 2700 

TCCAAACAAT GCTTTAGCAC GATCAATTGC GATGCTTTCA GTAACATCTA CAAACTCACA 2760 
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TTGTGCTTCC ATAACCGCTT 


CCGATACAAA ATTTTCCGAT 


GCGATTAACT 


CTATGTTOCT 


^ O O A 




ATTTTGTCTC 


TGAAATTCTC 


TCTCGATTGC 


TTCTGCGATA 


ACTTTATCTT 

w xxx «v a x x 


GCTTGGTGAT 

*J x X \J^f9x- x 




5 


ATAAGACATA AAATCTCCCC 


TTCTTTCAAA AAAACTTATT 


GGTATTTAGC 


ACGTTCGCCA 


JUUU 




CCAATCTTTT 


TCGGCCTAGA 


TGTGGCAATA 


GTTACAATTG 


CfTPGTCPTAC 
s»v x \j x vv in^i 


TTGrTTTArT 

X * VJ V* XXX «^v*> x 






GAGGTCCTTA CAGGTACACA TACATGTTTA ATATG CATGC 


tTATTAACC^T 1 


TTGACCAATA 




10 


TCAATTCCAC 


AAGGAACAGT 


AATATGTTCG 


ACCACGATCG 


wix u^i i v— /» x 


ATGCTY5AAAA 


lion 




GCGTATGTTG 


CCAAACTCCC 


TCCAGCATGT 


ACATCTGGAA 






3240 


1S 


GTTAATGGAT 


TATACTGAGA 


TTTTTCTATT 


GTTATCGCTC 


*TY^iT"TY2tA*F71*IY2 




3300 


TGAAAAGCAA 


AAGTAACG CC 


TGTPTCTTTA 

X \* X W X V* X X x*» 


CTCACAACAT 




7A T\ TV TV MfPTt^TT 

AAAAATAGTT 


3360 




*i*C]PQCAACTT 


CCaTCGAACC 


GACAGTCCCT 

x wvw x 


r\ X X X X X X \>\I\r 


CAATGALT1 1 X. 


CGATGl 1GAA 


3420 


20 


CATCCAATTA 


AACATATATC 


x X x xnX Xn 




TATCTTTTAA 


TTCGTCTAAT 


3480 




AACATTGTCA 


x v xxx ^/vi 




f n^rrv^TAAA 


AATAAAAAAG 


G AAT AT AG CA 


3540 




AAGTGCTACA 


vivvivini x 


nlnnu X XnX X 




CATATACTAA 


TTATACAGAA 


3600 


25 


» A W^V^X^^^r X^^*J 


CAAATAATAT 


viii xmx x x 


• T2VAA AfTAAXl 


CTTACAAGTT 


CTTCATAGGT 


3660 




ATGTACATAC 


ATTTCTTTTG 


TTCCACOGTA 


" TYSOATTTATA 


ACTTCTCCTG 


CTTCTTTtAC 


3720 




ATATT CATGC 


AATGTGAAAA 


CATGATTTTG 


CAAACCAAAG 


TGTGCCTCTA 


TTAATTCTTT 


3780 


30 


GTGCGAATAC 


GACATCGTCA 


AAATAATATC 


TGCTTTCAAA * 


TCTGCTTCAG 


TAAATTGTTG 


3840 




CGATAAGGTC 


GTTTCAG CTA 


AATGATGTTC 


TTCAACTAAG 


TCTx 1CAACAT 


AATTCGAAAC 


3900 




ACCTTGATTG 


TTCACAGCGA 


ATATACCTCT 


TGATTCAAAT 


TGATG ATTTG 


GCATAACCTC 


3960 


35 


TTTTGCAATA 


CTTTCCGCTA 


ATGGGCTACG 


ACATGTGTTA 


PPTVTlOTi TV TV 

LL I 1 ALAAA 


f*f* TV 7V T>T\ fV TV TV OH 


4020 




CTTGATAGTT 


CACATCCTTT 


AATAATGTGA 


TTACCTGCAG 




UVwil 1 Wtxit 


4 080 


40 


ATTGCTTCTG 


TATTATCATT 


CAGCTCAAAG 


CCGTATATAT 




AATATTTTCA 


4140 


TTTTCATCAA 


GTGAATGTAA 


CACATCATAA 


AGATTATGAC 


X X X XwX X X 


a a n A*rr* a t*ty2 

nnLnlUil xw 






TCATCCTGAC 


ATAATTGAAT 


GAATTGCGCT 


TCACTTGGTA 


T AAAffW^A C 


V_ X 1A1 




45 


GGCACAATAA 


AAGCTATAGA 


AGACCAATCT 


TTACCGTCAT 


TTCCAATTTT 


GCTCTCAATA 


4320 




TCTGTAATAA 


TTGTAAGTGG 


TGTATTGGGT 


GAGTAATGCT 


TATACTTCAT 


ACCTGGTGCA 


4380 




ATTGGCTGTT 


CAGTATCATT 


AT AAT CAGCA 


TGGGCGATAC 


TATTCGGAAG 


TATTTCTGTA 


4440 


SO 


ATCATTGCTG 


CTGTTATAGA 


ACCAGGTCTT 


GCAATTTTAT 


AAGGAAAAGA 


TGTGCAATCT 


4500 




AAAACCGTAC 


TTTCTAATCC 


TTCTTCACTT 


TGTTCAGCTT 


GAACAATACC 


ATCGATACGG 


4560 
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GCACTTGGAG CAGCTAGAGG TTCATTTATG ATTTGTAATA ATTGTCTACC TACAGAATGG 4660 

CTTGGCATTC TAACAGCAAC TGATGATAAA CCTCCAGAAA CTTTTCGACA TAGATAGCCT 4 74 0 

5 AGCTTTAACG GCAATATAAA CGAAATAGGG CCCGGCCAGA ATGCCTGCAT TAACTTTTCT 4800 

ACGCGTGGAT CCAAAGTATA TGTAAAATCT TTTAATTGAC CTTTACTGTG TATATGAACA 4860 

ATAAGCGGAT TGTCAGATGG ACGGCCTTTA GCTTCATATA TTTTAGCTAC AGCTTCTTCA 4 920 

10 TCTGTOGCAT TTGCTGCAAG TCCATAAACT GTTTCAGTTG GTAAACCTAT TAAACCACOG 4980 

TTTAAAACAA TGTCTTTTAT TTCATTAATT TTAGGATATT GCTGTAAATC TTCATTATAT 5040 

TCTCTAACAT CCCAAATTTT AGTATCCAAC TTAATCACGC CTTTCTTATT TATCATAATA 5100 

TAAAGCAAAA AGCTATGCAC TTAACTAATC ATAGCAAAGG CATAACTTCT AATTACCATT 5160 

TAAATGAGAC GATTCGATCG TGGCCATTTA TATCTTTAAT AATGTCGATT TTTTTGTCAG 522 0 

GAAATTTATT TAAAATTATT GATTTAAGTG CCTCACCTTG ATTGTAACCA ATTTCAAAAA 5280 

CAACTGGGCT GCCTTTTTCC ATAAOGTGAG GTAAATCTTC AATGATTGAT TCATAAATAG 5340 

CATATCCATG GTTATCTGCA AAGAATGCCT GATGTGGTTC GAATCTCGTA ACCGTTGGAG 5400 

ACATCGTAAC CATATCTTTT TCATCTATAT ATGGTGGATT AGATATCAAG CCGTTCAACT 54 6 0 

TGATACCTTC ATTAATTAAG GGCTTTAATG CATCCCCTGT TAAAAATTGT ATTTGTGATT 5520 

GATGCTTCTC AGCATTATTA CG AG C CAT AT TCATTGCTTC AAGTGAAATA TCAGTAGCAA 5580 

30 TAACATTTAA ATCCGGCTTT TCACATTTCA AAGTAATTGC AAGTACACCA CTACCCGTTC 564 0 

CGATATCTAC GATTGTTGCA TCATCTTCTA ACTGTTGTAA GAAATGCAAC ATTACTTCTT 5700 

CAGTTTGAGG TCTTGGTATC AAACAATTTG AGTTTACATC AAACGTTCTA CCATAAAATG 5760 

35 AGGGAAAGCC AACTATATAC TGTATAGGCT CTCCTAATAA CATACGTTGT AATGCTAAGT 5820 

CGAACTTCAT AATCATCGCT TTCGGCATAT CATCATGCAT GTGGACTACA AAGTCCGTAC 5880 

GCGTCCATTG AAATACATCT AACATTAACC ATTCAGCTCG TGTTTGTTCA AACCCTTTTT 5940 

40 

GTTGTGTTAA ATGAATTGCT TCATCTAACT TTTCTTTATA ATTCACCATT ATTAAGTTCT 6000 

TTCAATTTAT CTGTCTGCTC TGATAAAGTC AGTGCATCTA TAATTTCTTC TAAATGGCCT 6060 

TCCATAATTT GCCCTAATTT TTGAAGCGTT AGACCTATAC GATGGTCTGT TACACGGCTT 6120 

TGTGGATAAT TATAAGTTCG AATACGTTCT GAACGATCAC CAGTACCGAC TGCTGATTTA 6180 

CGTTGTGACG CATACTTTTG TTGTTCTTCT TGAACTTTCA TATCGTATAA ACGTGCTTTT 6240 

AACACTTTCA TTGCTTTTTC ACGGTTTTGA ATTTGAGACT TCTcAGAAGA TGTTGCAATG 63 00 

ACACCAGTTG GTAAATGGGT AATACGTACT GCAGAGTCAG TTGTGTTTAC GTGCTG AC CA 6360 



15 



20 



25 



45 



SO 



55 



688 



EP 0 786 519 A2 



5 



10 



IS 



20 



35 



40 



ACATCTTCAA 


CTTCTGGTAA AACTGCCACT GTAGCTGTTG AAGTATGAAT 


ACGTCCACCT 


6480 


GATTCTGTTT 


CAGGCACACG 


TTGAACGCGG TGCGCACCAT TTTCAAATTT 


CAATTTACTA 


6540 


TACGCGCCAT TACCAGAAAC TGAGAAACTA ATTTCTTTGT AACCACCATO 


GTCACTTTCA 


6600 


GACQCTTCTA 


CTATTTCAGT 


TTTGAATCCT TGTGATTCAG CATACTTTGA ATACATACGC 




ATTAAATCAC 


CAGCAAAAAT 


CGCAGCCTCA TCACCACCTG CTGCTGCTCT 


T ATTT CTACA 


6720 


ATAACGTCTT 


TGTCATCATT 


AGGATCTTTA GGAATCAATA ATATTTTAAG 


CTCTTCTTCA 


6780 


AGATTTGGAA GTTCAGCTTT AATACCATTA CTCTCCTCTT TTAACATTTC 


TACTTCTTCT 


6840 


TFATCATCAG 


TCTCACTTAA 


CATTTCTTCA ATATCAGCTA ATTCTTCTTT 


TTTAGCTTTA 


6900 


TAGTTACOAT AAACATCTAC AUTrrmXiT AAATCAGCTT GCTCTTTAGA 


ATATTTACGT 


6960 


AATTTATCTG AATCATTTAC AACATCTGGG TCACTTAACA GTTCATTTAA 


CTOTTCGTAT 


7020 


CTTTCTTCTA 


CAATATCTAA 


TTGATCAAAC ACTTATAATT CCTCCTTATT 


ATTATCACTA 


7080 


GGTGCTACGA 


TATGGTGCGC 


GCGACAACGT GGCTCATAAC TTTCATTGGC 


ACCTACTAAG 


7140 


ATAATCGGAT 


CATCGATTTT 


AGCTGGTTTA CCATTTATTA ATCGTTGCGT 


TCTACTAGAT 


7200 


GAAGAACCAC AAACAGCACA AACTGCTTGA AGTTTCGTTA CTTGTTCACT GACAGC CATC 


7260 


AATTTAGGCA 


TTGGTTCGAA CGGTTCGCCC CTAAAATCCA TATCTAATCC 


AGCAACAATA 


7320 


ACACGGTGTC 


CATCTGCTGA 


TAGTTTTTCT ACTATACTTA CAATTTCATC 


GTCAAAAAAT 


7380 


TGCAcTTCGT 


CTATTCCTAT 


AACATCAACA TTAGTTAAGT CGTGCGTCAT 


AATTTCACTT 


7440 


GCTTTAGAAA 


TATTAATCGC 


TTCAATGGCA TTACCATTAT GAGAGACCAC 


TTTTTCTTTA 


7500 


TGATATCGAT 


CATCAATCGC 


CGGTTTAAAT ACAACGACTT TTTGTTTAGC 


GTATATACCC 


7560 


CTTCTTAGAC 


GTCTTATTAG 


TTCTTCGGAT TTACCGCTAA ACATACTACC 


TGTAATACAT 


7620 


TCTATCCAAC 


CGGAATGGTA 


AGTTTCATAC ATTGAGAGTn CCACCTTTTT 


CAAAACATAA 


7680 


TCGCTTTATT 


ATATCATATT 


TCAAATATTC ATAAATGTCT TTnTCATAAT 


TATATCGATA 


7740 


TTGTACATGA 


ACAATTATTT 


TA 




7762 


(2) INFORMATION FOR SEQ ID NO: 125: 







(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 2583 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



50 

(xi> SEQUENCE DESCRIPTION: SEQ ID NO: 125: 
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TAAAAAAATT ATTATCAATO ATGAACTAGA ATTGACTGAA TTCCACCAAG AACTTACTTA 120 

TATTTTAGAC AACATAnAAG GGAATAATAA TTATGGTAAG GAATTTGTTG CAACCGTTGA 180 

AGAAACATTC GACATTGAAT AaAGCGGGGT GgaAGCACTA TGAATCAATG GGATCAGTTC 240 

TTAACACCTT ATAAGCAAGC GGTTGATGAG TTGAAAGkGA AcTTaAAGGC ATGCGCAAAC 300 

AATATGAAGT TGGTGAACAA GCGTCGCCAA TAGAATTTGT TACTGGTCQT GTTAAACCAA 360 

TCGCTAGTAT TATAGATAAG GCAAACAAAC GACAAATACC ATTTGATAGG TTAAGAGAAG 420 

AAATGTACGA TATCGCTGGT TTAAGAATGA TGTGCCAATT TGTTGAAGAT ATTGATGTTG 480 

TCGTCAATAT TTTAAGACAA AGAmAAGATT TTAAAGTAAT TGAAGAACGA GATTATATTC 540 

GTAACACTAA AGAAAGTGGT TACCGCTCGT ATCATGTCAT TATTGAATAT CCAATTGAAA 600 

CATTACAAGG CCAAAAATTT ATATTGGCTG AGATTCAGAT TCGTACATTA GCAATGAATT 660 

TCTGGGCAAC GATTGAACAT ACTTTACGAT ATAAATATGA TGGTGCTTAT CCGGATGAAA 72 0 

TTCAACATCG TTTGGAAAGA GCGG CAGAAG CAGCGTATTT ACTTGATGAA GAGATGTCTG 780 

AAATTAAAGA TGAAATTCAG GAAGCTCAAA AATATTACAC GCAAAAACGT TCTAAAAAAC 840 

25 ATGAAAATGA TTAACGAGGT GTTATAAATC ATGCGTTATA CAATTTTAAC TAAAGGTGAC 900 

TCCAAGTCTA ATGC CTTAAA GCATAAAATG ATGAACTATA TGAAAGrTTT TcGCATGaTT 960 

GaGGATrGTG AAAaTCCTGA AATTGTTATT yCAGTTGGTG GTGACGGTAC ATTACTACAA 1020 

30 GCATTCCATC AG TAT AG CCA CATGTTATCA AAAGTGGCAT TTGTTGGAGT TCATACAGGT 108 0 

CATTTAGGAT TTTATG CGGA TTGGTTACCT CATGAAGTTG AAAAATTAAT CATCGAAATT 114 0 

AATAATTCAG AGTTTCAGGT CATTGAATAT CCATTGCTTG AAATTATTAT GAGATACAAC 1200 

GACAACGGCT ATGAAACAAG GTATTTAGCA TTAAATGAAG CAACGATGAA AACTGAAAAT 1260 

GGCTCAACAC TTGTTGTGGA TGTTAACTTA AGAGGGAAAC ACTTTGAGCG ATTTAGAGGC 1320 

GATGGATTAT GTGTATCAAC ACCTTCGGGT TCAACGGCTT ATAACAAAGC GCTAGGTGGC 1380 

GCACTGATAC ATCCTTCACT TGAAGCAATG CAAATTACAG AAATTGCCTC GATAAATAAT 1440 

CGTGTGTTTA GAACGGTAGG ATCACCACTT GTATTACCAA AGCATCATAC ATGTTTAATA 1500 

TCACCAGTTA ATCATGATAC CATTAGAATG ACGATAGATC ATGTTAGTAT CAAACATAAA 1560 

AATGTTAATT CAATACAATA CCGTGTAGCA AATGAAAAAG TGAGGTTTGC ACGTTTTAGA 1620 

CCATTCCCAT TCTGGAAACG TGTGCACGAT TCTTTCATAT CAAGTGATGA AGAACGATGA 1680 

AATTTAAGTA T CAT AT ATCA CAACAAGAAA CTGTTAAAAC TTTTTTAGCA CGACATGATT 174 0 

TTTCTAAGAA GACAGTGAGC GCCATTAAAA ATAATGGCGC TTTAATTGTT AATGATGAAC 1800 
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AAATACCGAG TGTTAATTTA ATACCTTATG CTCGTAAGCT AGAAGTATTG TATGAAQATG 1920 

CTTTTATCAT CATAGTTACT AAACCAAACA ATCAAAATTG TACGCCTTCG AGAGAACATC 1980 

CTCATGAAAG TTTAATCGAA CAAGTACTAT ATCATTGTCA GGAACATGGT GAAAATATTA 2040 

ACCCACATAT TGTTACGCGT CTAGATCGTA ATACAACTGG TATTGTGATA TTCGCTAAAT 2100 

ATGGACATAT CCATCATTTA TTTTCTAAAG TAAACTTGAA AAAAATATAT ACTTGCCTTG 2160 

TATATGGTAA AACCCATACA TCTGGTATTA TTGAAGCTAA TATTAGACGG TCAAAGGATA 2220 

GGATTATAAC TAGAGAAGTT GCCTCGGATG GTAAATACGC TAAAACATCT TATGAAGTAA 2280 

TAAATCAGAA TGATAAATAC AGTTTATGCA AAGTTCATTT GCATACGGGA CGTACACATC 2340 

AAATTCGTGT ACATTTTCAA CATATTGGGC ATCCAATTGT GGGAGATTCT TTGTATGATG 2400 

GTTTTCATGA CAAAATTCAT GGTCAAGTAC TGCAATGTAC GCAAATATAT TTTGTTCATC 2460 

CAATCAATAA GAACAATATT TATATTACAA TTGATTATAA GCAATTACTT AAATTATnCA 2520 

ATCAACTCTA ATnCACACAG GGGGTGTAAG TATGTCAATG AnCACAGATG AAAAAGAGCG 2580 

TGT 2583 
25 (2) INFORMATION FOR SEQ ID NO: 126; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1818 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 

30 <D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 126: 

35 ^ 

ATCAAGTGAT ACATTTAACT GGTAAAGGAT TAAnAGATGC TCAAGTTAAA AAATCnGGAT 60 

ATATACAATA TGAATTTGTT AAAGAGGATT TnACAGATTT ATTnGCAATT ACGGATACAG 120 

TAATAAGTAG AGCTGGATCA AATGCGATTT ATGAGTTCTT AACATTACGT ATACCAATGT 180 

40 

TATTAGTACC ATTAGGTTTA GATCAATCCC GAGGCGACCA AATTGACAAT GCAAATCATT 240 

TTGCTGATAA AGGATATGCT AAAGCGATTG ATGAAGAACA ATTAACAGCA CAAATTTTAT 300 

45 TACAAGAACT AAATOAAATG GAACAGGAAA GAACTCGAAT TATCAATAAT ATGAAATCGT 360 

ATGAACAAAG TTATACGAAA GAAGCTTTAT TTGATAAGAT GATTAAAGAC GCATTGAATT -420 

AATGGGGGGT AATGCTTTAT GAGTCAATGG AAACGTATCT CTTTGCTCAT CGTTTTTACA 480 

60 TTGGTTTTTG GAATTATCGC GTTTTTCCAC GAATCAAGAC TTGGGAAATG GATTGATAAT 540 

GAAGTTTATG AGTTTGTATA TTCATCAGAG AGCTTTATTA CGACATCTAT CATGCTTGGG 600 
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CTCATGTTAA 


AGCGCCACAA 


AATTGAAGCA 


TTATTTTTTQ 


CATTAACAAT 


GGCATTATCT 


720 


GGAATTTTGA 


ATCCAGCATT 


AAAAAATATA 


TTCGATAGAG 


AAAGACCTAC 


ATTGCTGCGT 


780 


TTAATTGATA 


TAACAGGATT 


TAGTTTTCCT 


AGCGGTCATG 


CTATGGGATC 


AACTGCATAT 


840 


TTTGGAAGTG 


GTATCTATCT 


ATTAAATCGA 


TTAAATCAAG 


GTAATTCAAA 


AGGTATTCTT 


9.00 


ATAGGGTTAT 


GTGCAGCTAT 


GATTTTATTG 


ATTTCCATAT 


CACGTGTATA 


TCTAGGTGTA 


960 


CATTATCCAA 


CAGATATTAT 


TGCCGGCATT 


ATTGGTGGAT 


TATTTTGcAT 


TATTTTATCA 


1020 


ACGTTATTAC 


TTAGAAATAA 


ATTAATAAAT 


TAAATAGTAA 


AAAAACAAAA 


GCAGTAAACC 


1080 


TAAAGTGTOG 


TAAGGGTTTA 


CTGCTTTTAT 


AAAACGTTGT 


TATAACGTAT 


ATTGTCTTTT 


1140 


ACGGGCATAT 


AAnAGGGGAA 


TATTTGAnAA 


TGACCAATCC 


AACAAGAACG 


AAACGTTGTG 


1200 


GGGGGGATGT 


TCTATGTGGT 


ATTGATAATC 


ATTTTCAACT 


ACTATTATAC 


ATTAGTGAGA 


1260 


ATCATTGTCA 


ATTAGAAACT 


AAAACTTTTT 


TTGAATATTT 


TTTAAGAATA 


GTAAATAAAA 


1320 


CGCATGATTA 


CGCTATTTTA 


GAAAATAAAA 


AAATTTGTAT 


TTCT CATTAG 


AATTAGAATA 


1380 


TTTAAAAGTG 


ATGAGGTTTA 


AACATTATAT 


TGTTTACATA 


CTCCTTTTGA 


ATTCATACAT 


1440 


TATGAAATGT 


tACTTCCAAG 


TTCAAAATCG 


CACATTGAAA 


TGATGTGTGA 


AATGTTTAAA 


1500 


CTACGGTCAT 


tTTGTGmAAA 


TAAAGrTAAT 


AACTATTCAT 


TTTACAATAG 


TGAAAAGTCA 


1560 


GTATATGACA 


ACAATTAATA 


TTGCGGTAAG 


GCCTTGTGTT 


ACAGTATTCT 


ATATTTAAGT 


1620 


ACTGCAATCA 


GAATTAACAG 


AATGCCATTA 


ACTGATTATT 


AAATATTTGA 


GTTAATAAAT 


1680 


AATTAATGAT 


TGTAGCTTGA 


AAAATTTAAA 


ACATGGTTAT 


TGATTTGTGA 


TAAAATTTAA 


1740 


ACGTAAACAA 


ACTAATTTAA 


AAAGCAACTA 


TTGTATAGAA 


AAATACAAAA 


TTTAAAATAT 


1800 


ATTACCTTAT 


TAGAAAAA 










1818 



(2) INFORMATION FOR SEQ ID NO: 127: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 12658 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

4$ 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 127: 
TGTTTAAACA ATAGGGGGAA TCTTATGATT GAAAAATTAG TAACCTTTTT AAATGAGGTT 60 
50 GTTTGGAGTA AG CCATTAGT TTATGGTTTG CTAATTACTG GTGTGCTATT TACATTGCGT 120 

ATgCGATTTT TTCAAGTTAG ACATTTTAAA GAAATGATTC GATTAATGTT TCAAGGAGAG 180 
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GGTACAGGTA ATATTGTCGG TGTATCTACT GCAATATTTA TAGGAGGACC TGGTGCAGTA 300 

TTTTGGATGT GGATTACTGC GTTTTTAGGT GCAAGTAGTG CTTTTATTGA ATCTACACTT 360 

GGTCAAATAT TCAAGAGAGT TGAAAATAAT GAATACCGTG GTGGACCAGC GTATTATATT 42 0 

GAATATGGTA TTGGTGGTAA ATTTGGTAAA ATTTACGGAA TTATCTTTGC TATTGTTACG 480 

ATTAT CTCAG TAGGTCTATT GCTTCCTGGT GTGCAATCTA ACGCTATAGC AAGTTCTATG 54 0 

CATAATGCGA TTCATGTTCC ACAATGGTTA ATGGGTGGTA TTGTTGTAGT TATTTTGGGA 600 

TTAATTATTT TTGGTGGTGT ACGTATTATT GCCAATGTTG CAACAGCCGT TGTACCATTT 660 

ATGGCAATTA TTTACATACT GATGGCTGTC ATTATCATTT GTATCAATAT ACAAGAAGTG 720 

CCAGCGTTAT TTGCATTAAT TTTCAAATCA GCATTTGGAT TACAATCTGC TTTTGGTGGT 780 

ATCGTTGGCG CAATGATAGA GATTGGTGTT AAACGTGGAT TATATTCAAA TGAGGCTGGT 840 

20 CAAGGTACAG GTCCACACGC AGCAGCGGCa g CAGaAGTAT CACATCCAAG TAAACAAGGT 900 

CTAGTACAAG CATTTTCAGT TTATATTGAT ACATTATTTG TATGTACTGC AACTGCTCTG 960 

ATTATACTTA TTTCTGGTAC ATATAATGTG ACTGATGGTA CGGTTAATGC GAATGGCACA 1020 

CCGCATTTAA TTAAAGATGG CGGTATTTAT GTTgAAAATG CAACAGGTAA AGATTATTCA 1080 

GGTACTGCGA TGTATGCACA AGCOGGCATt GATAAAGCGT TCCATGGCAG TGGTTATCAA 114 0 

TTTGATCCTA CTTTCTCTGG CGTAGgTTCG TACTTTATTG cATTTGCTTT ATTCTTCTTT 1200 

GCATTTACTA CAATTTTGTC GTACTACTAC ATTACAGAAA CAAATGTTGC TTATTTAACG 1260 

CGTAATCAAA ATAATCAAGT TTCATCGATA TTTATTAATA TTGCTCGTGT GATTATTTTG 1320 

TTCGCTACAT TTTACGGTGC AGTTAAAACA GCTGATGTAG CATGGGCATT CGGTGATTTA 1380 

GGTGTAGGTC TAATGGCTTG GTTAAATATC ATTGCGATTT GGATTTTACA TAAGCCTGCC i440 

GTAAATGCTT TAAAAGATTA TGAAATTCAA AAGAAACGTT TAGGCAACGG TTATAATGCA 1500 

GTTTATCAAC CTGATCCGAA TAAATT AC CT AATGCTGTCT TTTGGTTGAA GACGTATCCA 1560 

GAACGTTTAA AACAAGCACG TGCCAAAAAG TAATCTACTT TTGTTTATAG TATATGTAGT 1620 

GATCATTTGA TAAAAAAGAA AAGTATTGAG AATTTTAGGt GCTCAGAAAT TTGAATTTTA 1680 

45 AAAATATAGT GTCTCTTGGT ACAATAACAA TACAACTACT AGGGGCACTT TTTTATGTCA 1740 

GAATTTAAAA CTGGTAAGAT TAATAAACAT GTTTTATATA GTAATATTTT AAATAGAGAT 1800 

GTCACGTTAA GTATTTATTT ACCAGAATCT TATAATCAAC TTGTTAAATA TAATGTCATT 1860 

50 CTTTGCTTTG ACGGATTAGA TTTTTTACGT TTCGGGAGAA TACAACGTAC ATATGAATCG 1920 

TTAATCAAAG AAGCGCGTAT TGATGATGCG ATCATTGTTG GATTCCATTA TGAAGACGTT I960 
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GTCGGTAAAG 


AAATATTGCC 


ATTTATTGAC 


TCGACGTTTT 


CTACACTGAA AGTAGGTAAT 


2100 




GCAAGGTTAT 


TAGTAGGGGA 


TAGTTTAGCG 


GGTAGTATTG 


CCTTATTAAC 


GGCGTTGACC 


2160 


5 


TATCCAACGA 


TTTTTAGTOG 


TGTAGCAATG 


TTAAGTCCAC 


ATTCAGATGA AAAAGTATTA 


2220 




GATAAGCTAA 


ATCAATGTGC 


AAATAAAGAA 


CAATTGACAA 


TTTGGCATGT 


CATTGGTCTA 


22B0 


10 


GATGAAAAAG 


ATTTTACTTT 


ACCAACAAAT 


GGTAAG CGTG 


CCGATTTCTT 


AACACCGAAT 


2340 


AGAGAATTAG 


CTGAACAAAT 


TAAGAAATAT 


AATATAACTT 


ATTATTACGA 


TGAATTTGAT 


2400 




GGTGGTCACC 


AATGGAAAGA 


TTGGAAACCA 


TTGCTGTCAG 


ATATATTATT 


GTATTTTTTA 


2460 


1S 


AGTAAAAACA 


CAGATGATCA 


ACTTTATGAA 


TAATTTACAT 


TAGTAGATTT 


AGTATGAATT 


2520 


GTCTTCATAT 


AGTCTGGTCT 


ATAATATAAT 


TTATAAAAGA 


TTTTACTGTT 


TAATTTAATT 


2580 




TAAATTTGAC 


GAAATTGCAA 


AAGATGTATA 


ATGAATTATT 


TTTAATGTAA 


CGGTTTTCAA 


2640 


20 


AGAAATTTGA 


TATAATAGCA 


ATAGGTTAAA 


CAAAGGAGGA 


ATTCAGATGA 


TTTTAGGATT 


2700 




AG CATT AATT 


CCATCAAAGT 


CATTTCAAGA 


AGCGGTGGAT 


TCTTACCGTA 


AAAGATATGA 


2760 




TAAACAGTAT 


TCACGAATTA 


AACCACATGT 


GACAATTAAA 


GCGCCATTTG 


AAATTAAAGA 


2820 


25 


TGGTGATTTA 


GATTCTGTCA 


TTGAACAGGT 


TAGAGCTCGT 


ATTAATGGTA 


TACCAGCAGT 


2880 




AGAAGTTCAT 


GCTACAAAAG 


CTTCTAGCTT 


CAAACCAACG 


AACAATGTGA 


TTTACTTTAA 


2940 




AGTTGCGAAG 


ACGGACGACT 


TAGAAGAATT 


GTTTAATCGC 


TTTAATGGAG 


AAGATTTCTA 


3000 


30 


TGGAGAAGCT 


GAACATGTTT 


TTGTGCCACA 


CTTTACAATA 


GCACAAGGAC 


TATCTAGCCA 


3060 




AGAATTCGAA 


GATATTTTTG 


GTCaAGTAGC 


ATTAGCTGGG 


GTAGACCaTA 


AAGAAATTAT 


3120 




CGATGAATTA 


ACTTTGTTAC 


GTTTTGACGA 


TGACGAAGAT 


AAATGGAAAG 


TTATTGAAAC 


3180 


35 


GTTTAAATTA 


GCTTAAGTAA 


CATAATAGTA 


TTGTTAATCG 


TAGTATGTTT 


GAATTAATAA 


3240 




GAAAATGGTC 


ATTTTTATTG 


AATGTAATAA 


AAATGAC CAT 


TTTCTTTATT 


TTAAAATACG 


3300 


40 


TTTTAACCTT 


ACTTAGCTTT 


TTCTCTATTT 


ACTATAAAGT 


rGCTTCCATA 


AAATACAGCT 


3360 


AAGACTAAAA 


AGATTAATGC 


CGAGAAATAA 


AATGTATTGT 


TTAAATTGTT 


GGTAAATTGT 


3420 




GT AATT AAT C 


CGCCAAATAA 


TGGCCCTATC 


ATTGAGCCGA 


ATCCTTGGAT 


ACTATTAAAA 


3480 


45 


ACACCCCAAG 


TTTCTTCTTG 


TTCATCTGAT 


TTGATAAATC 


GTGC CATAAA 


GGTATTCCAT 


3540 


GCTGGTAATA 


AGATGCCATA 


CATTAGACCG 


ATAGCTAAAG 


CGATAATCCA 


CAAGATGTGA 


3600 




ATATTAACAA 


TCATAGATAG 


AGTAAAAATT 


AATATCATGT 


ATAAAATAAA 


TCCGCTTAGA 


3660 


50 


ATAACACCAT 


ACATAAAGTT 


TCTGCTGCGG 


TTATCTATTA 


GTTTCGATAA 


AAATAGCATC 


3720 




GAAACTGCAC 


AGCCGATACC 


AC CAAT AATG 


ATTGCAACAG 


TATATTCAAT 


TGTGCTTACG 


3780 
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TGTAAAAGAA TACCAGGGAA CaACAATAAA TOQcGCTTTG TCACATCAAC AATTTGTCTC 3900 

AATTGAGCTT TAACTGGACG AGTATTATAA TTTGTTAACT TTACATCGAC AAAATAATAT 3 960 

AATATCCATG CAATTAAAAC GACTAAAGAC ATCATGAAGG CAAAGCGTGT TGGGTGCACT 4020 

TTGATAAGTA GATTCATAAA AACCATACCT ACCAATAGGC CTAACAACCA TGAAAAATAA 4 080 

ACATAGCCCA TTTGTTTGCC ACGTTTATCT TCTTCAACAC TGGATAACAT AATGACCCAA 4140 

ATAGGACTAA CTGCAATACC GAGCATCATA GCACTAAATA TGATTACAAA AGGTGATGCT 4200 

GGAAACCAAA TAACTAAAAA TAAACTTGTA AATGCTAAAA TAAATCCAGT CGTTAAAACG 4260 

ATTTTTGTGC CGAATTTTTT CAGTAAAAAT CCTATAACAA AGTTTGTAGA TGCATCAOCA 4320 

ATAAAATGTA TTGAAAATGC TAGAGACGTT ATTGCTACAG CAATGGATGT AACTGTTGGC 43 BO 

AAGAAATTAA TATAGCTTAG GATATACATG CCTCTCGCAA ATTCCATTAA AAATAAGATA 4440 

20 ATAAGCaTTA AAATGAAATT TTTATGATTA GCGTAATTAT TTAACGAAGA ATCTTGCATA 4500 

TAAAGGAACC TTTCCATAAA TCTCTTGTGG TTGTGATGAA TGACCGATTA AATCAAGTAA 4560 

GTCTCGACAT ATTGTCTGTG TAGCATACTT AATTTTATCT TGTTCCATTG TACTAATCAT 4620 

25 GTTAGTTAAT TGCTCATTAC CGTTAGTTAA ACTTGCTACA ATTTTTATTG CTTCTTCTGG 4660 

AGTATCAGCG ATTTTACCAA AACCTTTTTC TTCAAAGTAA AGGGCATTTT CAAGCTCTTG 4740 

ACCAGGTGCA GGATTTAGGA AAATCATTGG AATACAACGG GCGAAACCTT CAGTTATTGT 4800 

30 GATAC CAC CA GGTTTCGTAA TCATAAGTTG ACTTGATGCC ATCCATTCAT TCATGTGTTT 4860 

GGTATAACCT AGAATCAATA CATTCTCGTT AGATTTAAAC TTAGCTGTTA AAGAACGCTT 4920 

TAGCTCTTTG C T CTTACCAC AAATCATAAC TACTTGTGCA TTTGCaCTTT tCGCTAATAT 4 9 80 

ATCAGTAATC ATCGTGTCAA AACCTTTAGA TACACCAAAT GCACCAGCTG aCATTAAAAT 5040 

AGTraGCTTA TCTGGATCTA AGTTGTTGTC TATTAACCAC TGCTTTTGAT TAATAGGCGT 5100 

TTCAAATTTG TTATCAATAG GAATACCTGT CaCTTTAACT GTTGAAGGAT CAATACCTAC 5160 

GTCTATGAAG TCTTGTTTCG TTTCTTTTGT TGCCACATAA TATCTTGTTG AATACGGCGT 5220 

AATCCAGTTT TTATGTAAGC GATAGTCTGT CATCACTGTA GCAACTGGAA TATTAATGTT 5280 

AAATTGCTCA GTTAGTACCG ACATAACTGG TGTAGGAAAC GTTAATAATA TTAAATCTGG 534 0 

CTTTTCTTTT ATCAATAAAT TAATTAACTT ATTAAGTCCA TAGTATTTGT AAAAACATTT 5400 

GTCTAGTTTA TCTGGGCGGC TGTAATAAAA CCCTTTGTAC ATATTTCTAA AATATTTAAA 54 60 

SO GCTATTGATA TACCATTTTT TACAAATAGA AGTCAAAATT GGATGAGCTT CCATAAATAA 5520 

ATCGTGCTCA ATGACGCTTA AATGGTCTAG ATTCATATCA TTAAGTTGAT TAACGATACT 5580 
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TTGAGTAACC ATTAATAGCC ACCCTCCQTT AGTTTGAAAA TTTTATTTAA GTGTAACTTA 5700 

TTTTACGGCA TTATAAAAGA AATAAAGACG CAAAGTCGTT ACATTTATAG CAATTTTAAT 5760 

5 CTATAGATGA ATTGATACAA AATAAAACGT TATTTTATAA AGCAATTTAT TGTTCTATGT 5820 

TTTATTTGTA TATTTAAAAT TATCCAGTAT ACAATTATAG CATATTTTTG GAAACAATTA 5880 

TGATATTATA CCATGTTACA AGATGGTTTT AATAATTTAA GATGAGCCAT AATTGTAAAA 5940 

10 

CTAATTCATA ATACCGTATG TTTTATTTTT AATAGTAGAA ATTAGAAAAT GCTGATTAGT 6000 

AGGATATAAC AGTGAAATTA TAAATTTATT AACATCAACA AAACGTGTAT AATAAACATA 6060 

TTGTAGAAAA AGGAGCGGTT CAGTTTGGAT GCAAGTACGT TGTTTAAGAA AGTAAAAGTA 6120 

15 

AAGCGTGTAT TGGGTTCTTT AGAACAACAA ATAGATGATA TCACTACTGA TTCACGTACA 6180 

GCGAGAGAAG GT AG CATTTT TGTCGCTTCA GTTGGATATA CTGTAGACAG TCATAAGTTC 6240 

TGTCAAAATG TAGCTGATCA AGGGTGTAAG TTGGTAGTGG TCAATAAAGA ACAATCATTA 63 00 

20 

CCAGCTAACG TAACACAAGT GGTTGTGCCG GACACATTAA GAGTAGCTAG TATTCTAGCA 6360 

CACACATTAT ATGATTATCC GAGTCATCAG TTAGTGACAT TTGGTGTAaC GGGTACAAAT 6420 

25 GGTAAAACTT CTATTGCGAC GATGATTCAT TTAATTCAAA GAAAGTTACA AAAAAATAGT 64 80 

GCATATTTAG GAACTAATGG TTTCCAAATT AATGAAACAA AGACAAAAGG TGCAAATACG 6540 

ACACCAGAAA CAGTTTCTTT AACTAAGAAA ATTAAAGAAG CAGTTGATGC AGGCGCTGAA 66 00 

30 TCTATGACAT TAGAAGTATC AAGCCATGGC TTAGTATTAG GACGACTGCG AGGCGTTGAA 6 660 

TTTGACGTTG CAATATTTTC AAATTTAACA CAAGACCATT TAGATTTTCA TGGCACAATG 6 720 

GAAGCATACG GACACGCGAA GTCTTTATTG TTTAGTCAAT TAGGTGAAGA TTTGTCGAAA 6 780 

GAAAAGTATG TCGTGTTAAA CAATGACGAT TCATTTTCTG AGTATTTAAG AACAGTGACG 6 840 

CCTTATGAAG TATTTAGTTA TGGAATTGAT GAGGAAGCCC AATTTATGGC TAAAAATATT 6900 

CAAGAATCTT TACAAGGTGT CAGCTTTGAT TTTGTAACGC CTTTTGGAAC TTACCCAGTA 6960 

40 

AAATCGCCTT ATGTTGGTAA GTTTAATATT TCTAATATTA TGGCGGCAAT GATTGCGGTG 7020 

TGGAGTAAAG GTACATCTTT AGAAACGATT ATTAAAGCTG TTGAAAATTT AGAACCTGTT 7080 

GAAGGGCGAT TAGAAGTTTT AGATCCTTCG TTACCTATTG ATTTAATTAT CGATTATGCA 7140 

45 

CATACAGCTG ATGGTATGAA CAAATTAATC GATGCAGTAC AG CC TTTTGT AAAGCAAAAG 7200 

TTGATATTTT TAGTTGGTAT GGCAGGCGAA CGTGATTTAA CTAAAACGCC TGAAATGGGG 7260 

6Q CGAGTTGCCT GTCGTGCAGA TTATGTCATT TTCACACCGG ATAATCCGGC AAATGATGAC 73 20 

CCGAAAATGT TAACGGCAGA ATTAGCCAAA GGTGCAACAC ATCAAAACTA TATTGAATTT 73 80 
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' CAAAAGGAAG 


AGAACCATAT 


CAAATCATGC 


CAGGG CAT AT 


TAAGGTC3POA 


V500 




CATCGAGATG 


ATTTAATTGG 


CCTTGAAGCA 


GCTTACAAAA AGTTCGGTGG 


IvWVrV 4W X X 




5 


GATTAATAAA 


AGATTTATTG 


ATGAAGGTAA 


AACTATTGAT 


GTTTATTTAT 


TPRAAC3PA.TT 


•7 C *3 rt 




AAATAACCAG 


ATAATCATTG 


CTATACCAGA 


TTGGTTTTGG 


TCATATCAGA 


TGGCAA1Y5AP 


7£on 

/oaU 




ATTAGATGAA 


GAAACTTGTT 


TTGAAGCAAT 


ACTCATGCAA 


TTGTTTGTTT 


X InMnunnun 


7740 


10 


GGAAGAGGCA GAATCGATTG 


CATCACAACT 


AACAGATTGG 


ATAGAAACAT 


IT! A A & A/2T* & 


T O rt A 

78 00 




GAAAGACTAA 


TGAACTTAAA 


GCAAGAAGTT 


GAGTCTAGAA 


AGACTTTTGC 


GATTATTTCA 


7860 


IS 


CATCCCGATG 


CAGGGA&AAP 


AJV/"Yl*P r P 11. H fT 


GAAAAACTAT 


TGTACTTCAG 


TGGTGCTATT 


7920 


WVJ X V3/WtJ\vV7VT 


Vj InUnu X 1AM 




ACTGGTAAAT 


TTGCGACAAG 


TGACTGGATG 


7980 
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ACTAGTTCAG 


TAATGCAATT 


TGATTACGAT 


8040 


20 


GATTATAAAA 


TCAATATCTT 




GGACATGAAG 


ACTTTTCAGA 


AGATACGTAT 


8100 




AGAACATTAA 


TGGCAGTTGA 
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GATCATGCAA 
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TAGTGATTTT 
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AATGTTGGTT 
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GTGAAGCCTT 


TGATAATGAC 


8520 




GCGCTGTTGA 


GTGGAGACTT 


AACACCTGTA 
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8580 


OS 


GTACAAAATT 


TCTTAAATGC 
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8700 


40 


CAAGCCAACA 


TGGACCCTAA 


ACACCGTGAT 


AGAATTGCCT 


TTATGCGTGT 


CGTTAGTGGT 


8760 


GCATTTGAAC 


GTGGTATGGA 


TGTTACTTTG 


CAACGTACTA 
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CGTTCAACGT 


CATTTATGGC 
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GAAACTGTGA 


ATCATGCTGT 


AGCAGGCGAT 


8880 


45 


ATCATTGGAC 


TATATGATAC 


TGGTAATTAT 


CAAATTGGAG 


ATACTTTAGT 


TGGTGGAAAA 


8940 


CAAACCTACA 


GTTTCCAAGA 


TTTACCACAA 


TTTACGCCAG 


AAATTTTTAT 


GAAAGTTTCT 


9000 




GCTAAAAACG 


TCATGAAACA 


GAAGCATTTC 


CATAAAGGTA 


TTGAACAATT 


AGTACAAGAA 


9060 


SO 


GGTGCGATTC 


AATACTATAA 


AACATTACAC 


ACAAACCAAA 


TTATTTTAGG 


TGCTGTTGGT 


9120 




CAGTTACAAT 


TTGAAGTTTT 


CGAACATAGA 


ATGAAAAACG 


AATATAATGT 


TGATGTTGTT 
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AAGATGAACA CATCAAGATC GATTTTAGTG AAAGATAGAT ATOACGATTT AGTATTCTTA 9300 

TTTGAAAATG AATTTGCAAC AAGATGGTTT GAAGAGAAAT TCCCTGAAAT TAAATTGTAT 9360 

AGTTTACTTT AACAGCTCAA TTGTATAATC GAATTTGTTA CATTAAAAAT AATTGTTTCG 9420 

TTGAAGAAAA ATAAATTGTA TATTTTAAAA GAAAAAGGTA TACTATGATG TATCAAATGA 94 80 

ATAACCTATG GCATTTTGTC AGAGGGGAGT AACTTAAGAA TCATGACCGT ATAAATGaTT 954 0 

CGACACTTTA TCGTCATTAC GArGATATCT TCCGGTAAAG TGGGCAATTT AAATTGCTTA 9600 

GTGAGACCTT TGCTATTTAT TTAGCATAGG TCTTTTTGTT TGTACTTAAC TTATTTATTT 9660 

AAAGGAGTTG TACATGTTAA TGGATCCAAG TTTGATCTTA CCTTATTTAT GGGTACTTGT 9720 

CGTTTTAGTA TTTTTAGAAG GCTTATTAGC AGCAGATAAC GCGATTGTTA TGGCTGTAAT 9780 

GGTTAAGCAC TTACCACCCG AACAACGTAA AAAAGCTTTG TTTTACGGTT TGTTAGGTGC 9840 

ATTTGTATTT AGATTTTTAG CATTATTCTT AATTAGTATT ATCGCGAACT TTTGGTTTAT 9900 

TCAAGCTGCA GGAGCGGTTT ACTTAATTTA TATGTCAATC AAAAATCTGT GGCAGTTCTT 9960 

TAAACACCCA GAAATTGAAA GTCCTGAAGC TGGAGATGAT CATCATTATG ATGAATCTGG 10020 

TGAAGAGATT AAAGCAAGTA ACAAATCATT CTGGGGAACT GTGTTGAAAA TAGAATTTGC 10080 

AGATATCGCA TTTGCCATTG ATTCTATGCT TGCTGCTTTA g CTATTGCTG TAACACTTCC 1014 0 

TAAAGTTGGT ATTCACTTTG GTGGTATGGA CTTAGGTCAG TTCGTAGTCA TGTTCCTAGG 10200 

TGGAATGATT GGTGTTATTC TAATGCGTTA TGCAGCAACA TGGTTTGTAG AGCTATTAAA 10260 

CAAATATCCA GGACTTGAAG GTGCAGCCTt CGCGATCGTT GGTTGGGTAG GTGTTAAATT 10320 

AGTTGTCATG GTATTAGCGC ACCCAGAGAT CGCTGTATTG CCTGAGCACT TCCCACATGG 103 8 0 

CGTATTATGG CAATCTATTT TCTGGACAGT ACTAATTGGA TTAGTAATTA TCGGTTGGTT 1044 0 

AGGTfCAGTT GTTAAAAATA AAAAATCGCA TAAATAATTG ATGTGAAGCG GACAATCTTA 1050 0 

ATTTAGTTTA AGGTTGTCCT TTTTCATTTA ATTGAGTGAT TTATGAAAAA TGGATTTTGA 10560 

AGAATGTGAA TCAAAAGATG CGATATAGTA TTAAGAAAAT GTGCCTTTTA TATTTAGCAT 10620 

TTTTTCAATA GAAATTATAT AGATTTTAAA GCAAATTAGG TGTTAATGTG TCATAATGAT 106 80 

AAGTGATTTT ATTGAATGGA GTGGACATTA GTGGATATTG GTAAAAAACA TGTAATTCCT 10740 

AAAAGTCAGT nACCsaCGTA AGCGTCGTGA ATTCTTCCAC AACGAAGACA GAGAAGAAAA 10800 

TTTAAATCAA CATCAAGATA AACAAAATAT AGATAATACA ACATCAAAAA AAGCAGATAA 10860 

GCAAATACAT AAAGATTCAA TTGATAAGCA CGAACGTTTT AAAAATAGTT TATCATCGCA 10920 

TTTAGAACAG AGAAACCGTG ATGTTAATGA GAATAAAGCT GAAGAAAGTA AAAGTAATCA 10980 
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AAATTCATTA GATTCAGTGG ACCAAGATAC AGAGAAATCA AAATATTATG AGCAAAATTC HI 00 

TGAAGCGACT TTATCAACTA AATCAACCGA TAAAGTAGAA TCAACTGAAA TGAGAAAGCT 11160 

AAGTTCAGAT AAAAACAAAG TTGGTCATGA AGAGCAACAT GTACTTTCTA AACCTTCAGA 11220 

ACATGATAAA GAGACTAGAA TTGATTCTGA GTCTTCAAGA ACTGATTCAG ACAGCTCGAT 11280 

GCAGACAGAG AAAATAAAAA AAGACAGTTC AGATGGAAAT AAAAGTAGTA ATCTGAAATC 11340 

TGAAGTAATA TCAGACAAAT CAAATACAGT ACCAAAATTG TCGGAATCTG ATGATGAAGT 11400 

AAATAATCAG AAGCCATTAA CTTTACCGGA AGAACAGAAA TTGAAAAGAC AGCAAAGTGA 11460 

AAATGAGCAA ACAAAAACCT ATACATATGG TGATAGCGAA CAAAATGACA AGTCTAATCA 11520 

TGAAAATGAT TTAAGTCATC ATATACCATC GATAAGTGAT GATAAAGATA AOGTCATGAG 11580 

AGAAAATCAT ATTGTTGACG ATAATCCTGA TAATGATATC AATACACCAT CATTATCAAA 11640 

AACAGATGAC GATCGAAAAC TTGATGAAAA AATTCATGTT GAAGATAAAC ATAAACAAAA 11700 

TGCAGACTCG TCTGAAACGG TGGGATATCA AAGTCAGTCA ACTGCATCTC ATCGTAGCAC 11760 

TGAAAAAAGA AATATTTCTA TTAATGACCA TGATAAATTA AACGGTCAAA AAACAAATAC 11620 

AAAGACATCG GCAAATAATA ATCAAAAAAA GGCTACATCA AAATTGAACA AAGGGCGCGC 11880 

TACGAATAAT AATTATAGTG ACATTTTGAA AAAGTTTTGG ATGATGTATT GGCCTAAATT 11940 

AGTTATTCTA ATGGGTATTA TTATTCTAAT TGTTATTTTG AATGCCATTT TTAATAATGT 12000 

GAACAAAAAT GATCGCATGA ATGATAATAA TGATGCAGAT GCTCaAAAAT ATACGACAAC 12060 

GATGAAAAAT GCCAATAACA CAGTTAAATC GGTOGTTACA GTTGAAAATG AAACATCAAA 12120 

AGATTCmTCA TTACCTAAAG ATAAAGCATC TCaAGACGAA GTGGGATCAG GTGTTGTATA 12180 

TAAAAAATCT GGAGATACGT TATATATTGT TACGAATGCA CACGTTGTCG GTGATAAAGA 12240 

AAATCaAAAA ATAACTTTCT CGAATAATAA AAGTGTTGTT GGGAAAGTGC TTGGTAAAGA 12300 

TAAATGGTCA GATTTAGCTG TTGTTAAAGC AACTTCTTCA GACAGTTCAG TGAAAGAGAT 12360 

AGCTATTGGA GATTCAAATA ATTTAGTGTT AGGAGAGCCA ATATTAGTCG TAGGTAATCC 12420 

ACTTGGTGTA GACTTTAAAG GCACTGTGAC AGAAGGTATT ATTTCAGGTC TGAACAGAAA 12480 

TGTTCCTATT GATTTCGATA AAGATAATAA ATATGATATG TTGATGAAAG CTTTCCAAAT 12540 

TGATGCATCA GTAAATCCAG GTAACTCGGG TGGTGCTGTC GTCAATAGAG AAGGAAAATT 12600 

AATAGGTGTA GTTGCAGCTA AAATTAGTAT GCCAAACGTT GAAAnTATGT CATTTGCA 12658 

(2) INFORMATION FOR SEQ ID NO: 128: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 6 04 8 base pairs 
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<C> STRANDEDNESS ; double 
(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 128: 

TGAAATnGAA TAGTACTATT GCAAGTGTAA AOAGGTTAAT TTTTGCCnCA CGCGGGACTT 60 

AAAAAGGCAA CCACTGGTTG TGACATATCC TTATTTACAT TTATAAATAT AAGGAGGAGG 120 

TAGTAGTGAA AGACTTATTG CAAGCACAGC AAAAGCTTAT ACCGGATCTC ATAGATAAAA 180 

TGTATAAACG TTTTTCTATT CTTACTACTA TCTCAAAAAA TCAGCCTGTC GGACGTCGAA 240 

1S GTTTAAGCGA ACATATGGAT ATGACTGAAC GTGTACTGCG TTCTGAAACA GATATGCTTA 300 

AGAAACAAGA TTTGATAAAA GTTAAGCCTA CCGGAATGGA AATTACAGCT GAAGGTGAGC 360 

AACTGATTTC GCAATTGAAA GGTTACTTTG ATATCTATGC AGATGATAAT CGTCTGTCAG 420 

AAGGTATTAA GAATAAATTT CAAATTAAGG AAGTTCATGT TGTTCCTGGT GATGCTGATA 4 80 

ATAGTCAATC TGTTAAAACA GAATTAGGTA GACAAGCAGG TCAATTACTT GAAGG CAT AT 540 

TACAAGAAGA CGCGATAGTT GCTGTAACTG GCGGATCCAC GATGG CATGT GTTAGTGAAG 600 

CAATTCATTT ATTACCATAT AATGTATTCT TCGTACCAGC CAGAGGTGGA CTAGGCGAAA 660 

ATGTTGTCTT TCAGGCAAAC ACAATTGCAG CCAGTATGGc aCAACAAGCT GGCGGTTATT 720 

ATACGACGAT GTATGTACCT GATAATGTCA GTGAAaCAAC ATATAATACA TTGTTGTTAG 780 

AG CCATCAGT CATAAACACT TTAGACAAAA TTAAACAAGC AAACGTTATA TTACACGGCA 84 0 

TTGGTGATGC GCTGAAGATG GCGCATCGAC GTCAATCACC TGAAAAGGTC ATTGAACAAC 900 

35 TTCAACATCA TCAAGCTGTC GGAGAGGCAT TTGGTTATTA TTTTGATACA CAAGGTCAAA 960 

TTGTCCATAA GGTTAAAACA ATTGGACTTC AATTAGAAGA CCTTGAATCA AAAGAC TTT A 1020 

TTTTTGCAGT TGCAGGAGGC AAATCGAAAG GTGAAGCAAT TAAAGCATAC TTGACGATTG 1080 

40 ' . 

CACCCAAGAA TACAGTGTTA ATCACTGATG AAGCCGCAGC AAAGATAATA CTTGAATAAG 1140 

AGATAAAAAG TTTAATACTT TTT AAATAT C ATTTTAAAGG AGGCCATTAT AATGGCAGTA 1200 

AAAGTAGCAA TTAATGGTTT TGGTAGAATT GGTCGTTTAG CATTCAGAAG AATTCAAGAA 1260 

GTAGAAGGTC TTGAAGTTGT AGCAGTAAAC GACTTAACAG ATGACGACAT GTTAGCGCAT 1320 

TTATTAAAAT ATGACACTAT GCAAGGTCGT TTCACAGGTG AAGTAGAGGT AGTTGATGGT 13 80 

GGTTTCCGCG TAAATGGTAA AGAAGTTAAA TCATTCAGTG AACCAGATGC AAG CAAATTA 144 0 

CCTTGGAAAG ACTTAAATAT CGATGTAGTA TTAGAATGTA CTGGTTTCTA CACTGATAAA 1500 

GATAAAGCAC AAGCTCATAT TG AAG CAGG C GCTAAAAAAG TATTAATCTC AGCACCAGCT 1560 
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ACAGTTGTTT CAGGTGCTTC ATGTACTACA AACTCATTAG CACCAGTTGC TAAAOTTTTA 1680 

AACGATGACT TTGGTTTAGT TGAAGGTTTA ATGACTACAA TTCAOGCTTA CACAGGTGAT 1740 

5 

CAAAATACAC AAGACGCACC TCACAGAAAA GGTGACAAAC GTCGTGCTCG TGCAGCGGCA 1800 

GAAAACATCA TCCCTAACTC AACAGGTGCT GCTAAAG CTA TCGGTAAAGT TATTCCTGAA i860 

ATCGATGGTA AATTAGATGG TGGTGCACAA CGTGTTCCTG TAGCTACAGG TTCATTAACT 1920 

10 

GAATTAACAG TAGTATTAGA AAAACAAGAC GTAACAGTTG AACAAGTTAA CGAAGCTATG 1980 

AAAAATGCTT CAAACGAATC ATTCGGTtAC ACTGAAGACG AAATCGTTTC TTCAGACGTT 2040 

y5 GTAGGTATGA CTTACGGTTC ATTATTCGAC GCTACACAAA CTCGTGTAAT GTCAGTTGGC 2X00 

GACCGTCAAT TAGTTAAAGT TGCAGCTTGG TATGATAACG AAATGTCATA TACTGCACAA 2160 

TTAGTTCGTA CATTAGCATA CTTAGCTGAA CTTTCTAAAT AATTTTAGTA TAGTTTTTAT 2220 

20 TCAAATACGC TAGTGCTCAG AACTATTTAG CATTAATTAA AGCTTATGAG TAAGCGGGGA 2280 

GCACAAACGC TTCTCCGCTT ATTTTTATAT AAAATTTCCT AATTACAAGG AGGAAACACC 2340 

ATGGCTAAAA AAATTGTTTC TGATTTAGAT CTTAAAGGTA AAACAGTCCT AGTACGTGCT 2400 

25 

GATTTTAACG TACCTTTAAA AGACGGTGAA ATTACTAATG ACAACCGTAT CGTTCAAGCT 24 60 

TTACCTACAA TTCAATACAT CATCGAACAA GGTGGTAAAA TCGTACTATT TTCACATTTA 2520 

GGTAAAGTGA AAGAAGAAAG TGATAAAGCA AAATTAACTT TACGTCCAGT TGCTGAAGAC 2580 

30 

TTATCTAAGA AATTAGATAA AGAAGTTGTT TTCGTACCAG AAACACGCGG CGAAAAACTT 2640 

GAAGCTGCTA TTAAAGACCT TAAAGAAGGC GACGTATTAT TAGTTGAAAA TACACGTTAT 2700 

35 GAAGATTTAG ACGGTAAAAA AGAATCTAAA AATGATCCAG AATTAGGTAA ATACTGGGCA 2760 

TCTTTAGGTG ATGTGTTTGT AAATGATGCT TTTGGTACTG CGCATCGTGA GCATGCATCT 2820 

AATQTTGGTA TTTCTACACA TTTAGAAACT GCAGCTGGAT TCTTAATGGA TAAAGAAATT 2880 

40 AAGTTTATTG GCGGCGTAGT TAACGATCCA CATAAACCAG TTGTTGCTAT TTTAGGTGGA 2940 

GCAAAAGTAT CTGACAAAAT TAATGTCATC AAAAACTTAG TTAACATAGC TGATAAAATT 3000 

ATCATCGGCG GAGGTATGGC TTATACTTTC TTAAAAGCGC AAGGTAAAGA AATTGGTATT 3060 

4$ 

TCATTATTAG AAGAAGATAA AATCGACTTC GCAAAAGATT TATTAGAAAA ACATGGTGAT 3120 

AAAATTGTAT TACCAGTAGA CACTAAAGTT GCTAAAGAAT TTTCTAATGA TGCCAAAATC 3180 

ACTGTAGTAC CATCTGATTC AATTCCAGCA GACCAAGAAG GTATGGATAT TGGACCAAAC 3240 

SO 

ACTGTAAAAT TATTTGCAGA TGAATTAGAA GGTGCGCACA CTGTTGTATG GAATGGACCT 3300 

ATGGGTGTAT TCGAGTTCAG TAACTTTGCA CAAGGTACAA TTGGTGTATG TAAAGCAATT 3 360 
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TCTTTAGGTT TTOAAAATGA CTTCACTCAT 
TACCTAGAAG GTAAAGAATT GCCTGGTATC 
5 AGTTTAAAGT GATGTGGCAT GTTTGTTTAA 

CATCGTGTTT CATCACTTTT CAAAAATATT 
ACCAATTATA GCTGGTAACT GGAAAATGAA 

10 

AATACATTAC CAACACTACC AGATTCAAAA 
ATTCAATTAG ATGCATTAAC TACTGCAGTT 

15 GGTGCTCAAA ATACGTATTT CGAAGATAAT 

GCATTAGCAG ATTTAGGCGT TAAATACGTT 
TTCCACGAAA CAGATGAAGA AATTAACAAA 

20 ACTCCAATTA TATGTGTTGG TGAAACAGAC 

GTTGTAGGTG AGCAAGTTAA GAAAGCTGTT 
GTTGTAATTG CTTATGAACC AATCTGGGCA 

26 GATGCAAATG AAATGTGTGC ATTTGTACGT 

GTATCAGAAG CAACTCGTAT TCAATATGGT 
TACATGGCAC AAACTGATAT TGATGGGGCA 

30 

GATTTCGTAC AATTGTTAGA AGGTGCAAAA 
TTATTTTAGA TGGTTTTGCG AACCGCGAAA 
ACAAGGCTAA TTTTGATCGT TATTACAACA 

35 

GCTTAGATGT TGGACTACCT GAAGgACAAA 
TCGCTGCAGG ACGTATCGTT TATCAAAGTT 

40 GTGATTTCTT TGAAAATGAT GTTTTAAATA 

CAGCGTTACA CATCTTTGGT TTATTGTCTG 
TATTTGCTTT GTTAGAACTT GCTAAAAAAC 

45 TTTTAGATGG CCGTGACGTA GATCAAAAAT 

CTAAATTCAA TGAATTAGGC ATTGGTCAAT 
TGGATCGTGA CAAACGTCGG GAACGTGAAG 

60 

ATGCCCCAAC TTATGCAACT GCCAAAGAAG 
CTGACGAATT CGTAGTACCA TTCATCGTTG 

55 



ATTTCAACTG GTGGCGGCGC GTCATTAGAG 34 80 

AAAGCAATCA ATAATAAATA ATAAAGTGAT 354 0 

CATTGTTACG GGAAAACAGT CACAAGATGA 3600 

TACAAAACAA GGAGTGTCTT TAATGAGAAC 3660 

CAAAACAGTA CAAGAAGCAA AAGatTCGTC 3720 

GAAGTAGAAT CAGTAATTTG TGCACCAGCA 3780 

AAAGAAGGAA AAGCACAAGG TTTAGAAATC 3840 

GGTGCGTTCA CAGGTGAAAC GTCTCCAGTT 3900 

GTTATCGGTC ATTCTGAACG TCGTGAATTA 3960 

AAAGCGCACG CTATTTTCAA ACATGGAATG 4 020 

GAAGAGCGTG AAAGTGGTAA AGCTAACGAT 4080 

GCAGGTTTAT CTGAAGATCA ACTTAAATCA 4140 

ATCGGAACTG GTAAATCATC AACATCTGAA 4200 

CAAACTATTG CTGACTTATC AAGCAAAGAA 4260 

GGTAGTGTTA AACCTAACAA CATTAAAGAA 4320 

TTAGTAGGTG GCGCATCACT TAAAGTTGAA 43 8 0 

TAATCATGGC TAAGAAACCa ACTGCGTTAA 4440 

GCGAAGATGG TAATGCGGTA AAATTAGCAA 4500 

AATATCCAAC GACTCAAATC GAAGCGAGTG 4560 

TGGGTAACTC AGAAGTTGGT CATATGAATA 4620 

TAACTCGAAT CAATAAATCA ATTGAAGACG 4680 

ATGCAATTGC ACACGTGAAT TCACATGATT 474 0 

ACGGTGGTGT ACACAGTCAT TACAAACATT 4800 

AAGGTGTTGA AAAAGTTTAC GTACACGCAT 4860 

CCGCTTTGAA ATACATCGAA GAGACTGAAG 4920 

TTGCATCTGT GTCTGGTCGT TATTATGCAA 4980 

AAAAAGCTTA CAATGCTATT CGTAATTTTG 504 0 

GTGTAGAAGC AAGCTATAAT GAGGGCTTAA 5100 

AGAATCAAAA TGACGGTGTT AATGATGGAG 5160 
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CGAACAGAGC ATTCGAAGGC TTTAAAGTTG AACAAGTTAA AGACTTATTC TATGCAACAT 5280 

TCACTAAGTA TAATGACAAT ATCGATGCGG CTATCGTCTT CGAAAAAGTT GATTTAAATA 5340 

ATACAATTGG TGAAATTGCA CAAAATAACA ATTTAACTCA ATTACGTATT GCAGAAACTG 5400 

AAAAATACCC TCACGTTACT TACTTTATGA GTGGTGGACG TAACGAGGAA TTTAAAGGTG 5460 

AACGCCGTCG TTTAATTGAT TCACCTAAAG TTGCAACGTA TGACTTGAAA CCAGAAATGA 5S20 

GTGCTTATGA AGTTAAAGAT GCATTATTAG AAGAGTTAAA TAAAGGTGAC TTGGACTTAA 5580 

TTATTTTAAA CTTTGCTAAC CCTGATATGG TTGGACATAG TGGTATGCTT GAGCCGACAA 5640 

15 TCAAAGCAAT CGAAGCGGTT GATGAATGTT TAGGAGAAGT GGTTGATAAG ATTTTAGACA 5700 

TGGACGGTTA TGCAATTATT ACTGCTGACC ATGGTAACTC TGATCAAGTA TTGACGGaTG 5760 

ATGATCAACC AATGACTACG CAwACAACGA ACCCAGTACC AGTGATTGTA ACAAAAGAAG 5820 

20 GCGTTACACT TAGAGAAACT GGTCGCTTAG GTGACTTAGC ACCTACATTA TTAGATTTAT 5880 

TAAATGTAGA ACAACCTGAA GATATGACAG GTGAaTCTTT AATTAAACAC TAATATTGTA 5940 

AAAGATGTTA AGTAAACGCT TAATGACACT TATTTTTTGA AAATAATAGT AATATCnTTT 6000 

25 

TGTTAAATGA AAGAATAAAG CTATAATAAT TATAGAATAA CTATTTAn 604 8 

(2) INFORMATION FOR SEQ ID NO: 129: 

(i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH : 5602 base pairs 

(B) TYPE: nucleic, acid 
<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION; SEQ ID NO: 129: 

AAAGAAGTGC AAGATATCAT CGCATTAATT AAGTCGTTAC AAAgTGTAAT TGTAGACaTC 60 

GCTTCCAATA ATGTTGATAC AATTATGCCT GGTTATACTC ATTTACAGCG TGCACAGCCA 120 

ATTTCATTTG CACATCATAT TATGACTTAT TTTTGGATGT TACAACGAGA CCAACAACGA 180 

TTTGAAGATA GTTTAAAACG AATCGATATT AATCCTTTAG GTGCAGCAGC CTTAAGTGGT 24 0 

ACCACATACC CTATCGATAG ACACGAGACA ACAGCATTGT TGAACTTTGG CAGfTCTCTAT 300 

GAGAATAGCC TAGATGCTGT TAGTGACAGA GACTATATTA TTGAAACATT GCATAATATT 360 

TCTTTAACGA TGGTTCACTT ATCACGCTTT GCAGAGGAAA TTATTTTCTG GTCCACAGAC 420 

GAAGCTAAAT T CATT ACATT ATCAGATGCA TTTTCAACTG GCTCATCTAT TATGCCACAA 4 80 

AAGAAAAATC CTGATATGGC AGAATTAATT AGAGGTAAAG TTGGTCGAAC GACTGGTCAT 54 0 
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GAAGATAAAG AAGGTTTATT CGATGCTGTC CATACAATTA AAGGTTCTTT ACGTATTTTC €€0 

GAAGGTATGA TTCAAACGAT GACAATTAAT AAAGAACGAC TCAATCAAAC TGTTAAAGAA 720 

GATTTTTCAA ATGCAACGGA ACTAGCAGAT TATTTAGTAA CTAAAAATAT TCCATTTAGA 780 

ACTGCACATG AAATTGTAGG AAAAATCGTC TTAGAATGTA TACAACAAGG TCATTATTTA 840 

TTAGATGTTC CTTTAGCAAC ATATCAACAA CATCATTCTA GTATTGATGC CGATATTTAC 900 

GATTATTTGC AGCCTGAAAA TTGTTTAAAA CGACGTCAAA GTTACGGTTC AACAGGTCAA 960 

TCATCGGTCA AACAACAACT TGATGTTGCT AAACAATTAC TATCACAATA AATACGTTAA 1020 

75 TCTACCTACC CACAATGTCT ATTAAAATTA CATTGTGGGT ATTTTAATGC TCTCTTCGTC 1080 

TTGTTGAACA TCACATTTTT AAGATTCCTA AAATGTTTGA TAATTCTTTT AAATTTATAT 1140 

TACAAAAATG TTATAAATTG TAAAAGAAAT GTGTAAAGCG TTTTCACAAG CAGGTTTTTG 1200 

20 TAGTATTTTA AAATTGTTAG ACTACAAATA AAGAGATGAA AGGATAAAGA CTATGACTAA 1260 

CTCTTCGAAA AGCTTCACTA AATTTATGGC TGCTTCTGCT GTTTTTACTA TGGGATTTTT 13 20 

ATCAGTACCT ACTGCTGGCG CTGAACAAAC AAATCAAATT GCAAATAAAC CTCAGGCTAT 13 80 

TCAATGGCAT ACAAATTTAA CGAATGAGCG ATTCACTACT ATCGCACATC GTGGCGCAAG 1440 

TGGCTATGCA CCCGAGCATA CGTTTCAAGC ATATGATAAG AGTCATAATG AGTTAAAAGC 1500 

ATCTTATATC GAAATTGATT TACAACGTAC CAAAGATGGC CATTTAGTTG CTATGCATGA IS 60 

TGAAACTGTT AACCGTACAA CAAATGGACA CGGTAAAGTT GAGGATTATA CCCTTGATGA 1620 

ATTAAAACAG TTAGATG CAG GAAGTTGGTT TAATAAAAAA TATCCAAAAT ACGCAAGAGC 16 80 

3S AAGTTATAAA AATGCTAAAG TACCCACTTT AGATGAAATT TTAGAACGTT ATGGCCCGAA 174 0 

TGCAAACTAT TATATTGAAA CAAAGTCACC TGATGTATAC CCAGGAATGG AAGAACAATT 1800 

ATTAGCTTCA TTGAAAAAGC ATCACCTTTT AAATAACAAT AAATTAAAAA ATGGACATGT 1860 

40 AATGATTCAA TCATTTTCTG ACGAAAGTTT AAAGAAAATT CATCGTCAAA ATAAGCATGT 1920 

GCCATTAGTA AAATTAGTTG ATAAAGGTGA ACTACAACAA TTTAACGACC AACGCTTAAA 1980 

AGAGATACGC TCTTATGCGA TTGGATTAGG TCCTGATTAT ACAGATTTAA CTGAACAAAA 2040 

TACCCATCAT TTAAAAGACT TAGGATTTAT AGTACATCCT TATACAGTGA ATGAAAAAGC 2100 

TGATATGTTA CGATTAAATA AATATGGCGT TGATGGTGTC TTTACAAATT TCGCTGATAA 2160 

ATATAAAGAA GTCATTAAGT AGTAATGTTA AACTAGAAAA CATAAATACA AAAATATAGC 2220 

TATTACTATA AAAAACAGCA GTAAGATATT TCCAAATTGA AATTATCCTA CTGCTGTCTT 2280 

TTTGGGAGTG GGACAGAAAT GATATTTTCG CAAAATTTAT TTCGTCGTCC CACCCCAACT 2 34 0 
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TTGTCTGTAG AAATTGAGGA GCTAATTTCT CTGTGTCOGG GCTCCACCCC AACTTGCACA 2460 

CTATTGTAAG CTGACTTTCC GCCAGCCTCT GTGTTGGGGC CCCGCCAACT TGCACACTAT 2520 

TGTAAGCTGA CTTTCCACCA GCCTCTGTGT TGGGGCCCCG ACTATTTTTG AAAAGAGCGT 2580 

GTTACACGGG CATTGTTTTA CAGTCAACTA CTGCTAAAAT AAAATTAACG AGCTTAGGGC 2640 

TTTGTTTTCT GTCCCAAGCT CGTTAAATCA CATATGATAA TTAATTATGC CCAACCACGA 2700 

TATCTAGCTG CTTCTGCTGT ACGTTTAATA CCTATGATAT ATGCTGCAAG TCTCATATCT 2760 

ATTTTTCGGT TTTGAGACAA TTOGTAAATC GTATCAAATG CCGCTTCTAA TTTTTCACGT 2820 

r5 AGCTTTTCAT TAACTTCTTC TTCAGACCAA TAATAACCTT GATTATTTTG TACCCATTCG 2880 

AAGTAAGAAA CCGTtACACC ACCAGCACTT GCTAATACGT CTGGAACTAA TAATATACCA 2940 

CGTTCAGTTA AAATACX5TGT TGCTTCTGGT GTTGTAGGTC CATTAGCAGC TTCAACAACG 3000 

20 ATACTAGCTT TAATATCATG TGCATTGTCT TCTGTAATTT GGTTTGAAAT AGCCGCTGGT 3060 

ACTAAAATGT CACAATCTAA TTCAAACAAT TCTTTATTTG AGATTGTTTC TTCAAATAAA 3120 

TTTGTTACCG TACCAAAACT ATCACGACGG TCTAATAAAT AATCTATATC TAAGCCATTT 3180 

GGATCGTGTA ATGCACCGTA AGCATCAGAG ATACCTACAA TTTTTGCACC TAAATCATAT 3240 

AAGAATTTAG CTAAGAAACT TCCGGCATTA CCGAAACCTT GAATAACAAC CTTGGCACCT 3300 

TCAATTTGCA TATTACGACG TTTTGCAGCT TGTTCAATTG CAATAACTAC ACCTAGTGCA 3360 

GTTGATCTGT CGCGTCCATG AGAACCACCC AATACAATTG GTTTACCTGT GATGAAACCT 3420 

GGTGAATTAA ATTTATCTAA TGCACTATAT TCATCCATCA TCCAAGCCAT AATTTGTGAG 3480 

TTTGTAAATA CATCTGGTGC TGGAATATCT TTGTTCGGAC CTACGAATTG TGAAATTGCT 3540 

CTTACATATC CGCGTGATAA ACGTTCAACT TCATGAATGC TCATTTGACG TGGATCACAA 3600 

ACGATACCAC CCTTACCACC ACCGTATGGT AAGTTTACAA TGCCACATTT CAAAGTCATC 3660 

40 CACATTGATA ATGCTTTTAC TTCTTCTTCA TCAACATCTG GGTGGAAACG CACGCCCCCT 3720 

TTTGTTGGTC CAACAGCATC ATTATGTTGC GCACGGTAAC CTGTGAATGT TTTTACTGTG 3780 

CCATCATCCA TTCGTACAGG GATACGCACT TGTAACATTC TTAAAGGTTC TTTAATTAAA 384 0 

TCGTACATTC CTtCGTCAAA TCCCAATTTA TGGAATGCTT CTTTAATAAT TCCTTGAGTA 3900 

GAAGTTACTA AATTATTGTT CTCAGTCATG ATCCTTTTCG CCTCTTCTTT ACCTAATGAT 3960 

TTCGCTTTCA AACATATTGT AACATAACGT ATTCCTTTTT AAAGCCCTTA CAAACTGATT 4020 

GTTACAACTT TTTGACATTA TTGAAATACA TGTCTTATTT TTTCAAGTGC AAGGTCCAAT 4080 

TCTTCTTTAG TAATAATTAA TGGTGGTGCA AAACGAATGA CAGTATCATG CGTTTCTTTA 4140 
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ACACCTATAA 


ACAAACCACG 


TCCACGGACT 


TCTTTAATTG 


ATGGATGATC 


AATTTGCTTT 


4260 


AATTGTTCTT 


TAAAATAATC 


TCCTAATTCT 


AAAGAGCGOC 


CTGGTAAATC 


CTCATCAACG 


4320 


ATAACATCTA 


ATGCAGCAAT 


TGATGCAGCA 


CAAGCAAGTG 


GATTACCACC 


AAATGTTGAA 


4360 


CCATGTGAGC 


CAGGTGTAAA GACATCTAAT 


ACTTCTTTAT 


CTGCTAATAC 


AACAGAAATT 


4440 


GGGAAGACTC 


CACCACCTAG 


TGCTTTACCT 


AAAATATAGA 


CATCAGGTTT 


TACATTATCC 


4500 


CAATCCGTAG 


CAAATAATTT 


ACCCGAACGA 


CCTAATCCTG 


CTTGGATTTC 


GTCAGCAATA 


4560 


AATAAGACAT 


TATGTTCATC 


ACATAATTCT 


CTAATTGCTT 


TCAAATATCC 


TTCTGGCGGT 


4620 


ATATTTATAC 


CCGCTTCACC 


TTGAATTGGT 


TCTACTAAAA 


CTGCTGCAGT 


ATTTTCATTA 


4680 


ATTGCAGCTT 


TCAATGCATC 


TACATCTCCA 


AAATGAACTT 


TTCTAAATCC 


ATCTAATAAC 


4740 


GOACCATAAC 


CAOGTTGGTA 


TTCTGCTTCT 


GAAGATAATG 


AAACTGGCGC 


CATTGTTCGA 


4800 


CCATGGAAGT 


T AC CATT AAA 


TGCAATGATT 


TCTGCTTTAT 


TTGGCTCAAT 


TCCTTTAACA 


4860 


TCGTATGCCC 


AGCGTCGTGC 


TGCTTTCAAA 


GCTGTTTCTA 


CTGCTTCAGC 


ACCTGTATTC 


4920 


ATTGGTAAAG 


CTTTATCTTT 


ACCTGCCAGT 


TTACAAATTT 


TTTCGTACCA 


TTCACCTAAG 


4960 


TT AT CACTAT 


GAAAAGCACG 


TGAAACTAAA 


GTCACTTTAT 


CAGCTTGATC 


TTTTAATGCT 


5040 


TGAATAATTT 


TCGGATGTCT 


ATGACCTTGG 


TTAACAGCGG 


AATATGCAGA 


TAACATATCC 


5100 


ATATATTTAT 


TGCCTTCAGG 


ATCTTTAACC 


CATACCCCTT 


CAGCTTcTGa 


AATGaCAATT 


5160 


GGcAATGGTA 


AATAATTATG 


TGCTCCGTAA 


TGATTTGTTA 


ACTCAATAAT 


TTTTTCAGAT 


5220 


TTAGTCATCA 


TATCTCCCCT 


TTTCATCATT 


TATAACTATT 


ATACATGAAA 


CATTATCCAA 


5280 


ATAATTACAT 


TAGTTTTCAA 


AGCAGATACT 


TTTCCACCAA 


AAAAGATGAA 


ATAATCACTA 


5340 


AGTTTGATTA 


AATTTGTCTA 


TTTTGAAAAC 


CCTTACATTT 


ATAATGACAT 


AATTACTTAA 


5400 


ATGatfTACAA 


GCAAAAGAAT 


TGATAATTTT 


ACACTTAATC 


AAAAGTATAT 


TTTACTAAGA 


5460 


ATATTTTTAT 


TTATAAATAT 


TGAAAACCAC 


TAACAAATTG 


CATACACAAT 


ATCATTAGTG 


5520 


GTAACAGTTA 


AACACTTATT 


TAT CTTTACG 


GGGTAATGGG 


TTAAAACCCT 


TnCATTAAAA 


5580 


TTGGATGnCC 


ATAAAATTAG 


GG 








5602 


(2) INFORMATION FOR SEQ ID NO: 130: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5924 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS : double 
50 (D) TOPOLOGY: linear 
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TAACCCCATT TTACCTGGAA AAATCgTTTG CGATGCaATm GCaTTtGaAT ATAaATACAT 60 

TTTACGTATa GAATTATAAA AgGTTTCATT CaAATCTTAG GGTCAAAAAT GTTATAATAT 120 

TTTTATGTCA AATTTAAAAC AGTAACACTT ATTTACAAGG TTGCAATATT TTGAAGTAAT 180 

AAAGGAAGTG TCGCGTATTT TAACTTTTTC AGAGCAAAAT GCACTCGCGA AAATAGATGA 240 

TTTAATGAAT ACTTATTGCA ATCAATGTCC AATCAAAACT CGTCTGCGTA AATTAGAGGG 300 

GAAAACGAAG GCGCATCATT TTTGTATCAA TGAGTGTTCA ATAGGGAAAG AAATAAAACA 360 

ATTAGGAAAT GAACTTCAAT AGGAGGAAGT CAAATGAAAA TTATATCTAT ATCAGAAACA 420 

CCGAACCACA ACACAATGAA GATTACACTT AGTGAAAGCA GAGAAGGTAT GACATCAGAT 480 

ACGTATACTA AAGTTGATGA TTCACAGCCA GCATTTATTA ATGACATCTT AAAGGTTGAA 540 

GGCGTTAAAT CAATTTTCCA TGTTATGGAC TTTATTTCAG TAGATAAAGA AAATGACGCA 600 

20 AATTGGGAAA CAGTATTGCC AAAAGTAGAG GCTGTATTCG AATAAATTTT TCATCAACTA 660 

GTATTCGGGG GGAATAAAGT ATATGGAAAT TTTACGTATA GAGCCAACAC CAAGTCCAAA 720 

TACAATGAAA GTTGTTTTGT CATATACAAG AGAAGACAAG TTATCTAATA CTTATAAAAA 780 

AGTAGAAGAA ACACAACCAA GATTTATAAA TCAGTTGTTA TCTATAGATG GTATCACTTC 84 0 

CATTTTTCAT GTCATGAACT TCTTAGCTGT TGATAAGGCA CCAAAAGCTG ATTGGGAAGT 900 

CATATTACCT GATATTAAAG CTGCTTTTTC TGATGCGAAT AAGGTTTTAG AATCTGTAAA 960 

TGAACCTCAA ATTGACAATC ATTTTGGTGA AATTAAAGCT GAATTATTAA CTTTTAAGGG 1020 

TATACCGTAT CAAATTAAGC TAACTTCTGC TGACCAAGAA TTAAGAGAAC AATTACCACA 1080 

AACATATGTT G AC CATATGA CTCAAGCGCA AACAGCACAT GACAATATTG TTTTTATGCG 114 0 

TAAATGGCTA GATTTAGGAA ATCGCTATGG AAATATTCAA GAAGTAATGG ATGGTGTCCT 1200 

AGAAGAAGTG CTAGCTACCT ATCCAGAATC ACAGTTACCC GTATTGGTAA AACATGCTTT 1260 

40 AGAAGAAAAT CACG CAACTA ATAATTATCA TTTCTATCGA CATGTCTCTT TGGATGAATA 1320 

TCATGCAACT GATAATTGGA AGACTCGATT ACGAATGTTA AACCATTTTC CAAAGCCGAC 1380 

TTTTGAAGAT ATACCGCTGC TTGATTTAGC TTTATCTGAT GAAAAAGTAC CGGTTAGACG 1440 

TCAAGCGATT GTATTATTAG GTATGATTGA AAGTAAAGAA ATTTTACCGT ATTTATATAA 1500 

GGGGCTTCGT GATAAAAGTC CTGCTGTAAG AAGAACAGCA GGGGATTGCA TAAGCGATTT 1560 

AGGGTATCCA GAGGCACTAC CAGAAATGGT GCTACTATTA GATGATCCAC AGAAAATCGT 1620 

TAGGTGGCGT GCTGCTATGT TTATCTTTGA TGAAGGTAAT GCAGAGCAGC TTCCCGCACT 1680 

AAAAGCCCAT ATTAATGACA ATGCGTTTGA AGTTAAATTA CAAATTGAAA TGGCCATATC 1740 
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AATTTAATTG 


GAGGAATTAA ATATGAATGC 


ATATGATGCT 


TATATGAAAG 


AAATTGCGCA 


1860 




ACAAATOCGT 


GG PGAATTAA 




TTTTACAAGT 


TTAGAAACGA 


GCGAACAGct 


1920 


5 


ATCGGAGTAT 


t\ X VnnVwlnu 


x /\n/t X\9W luii 


TGACACTACT 


TTTGTAGTTA 


TTAACTCTAC 


1980 




ATGCGGCTGT 






AGCTGCAGTA 


GCAGTTGCAA 


CACAAAATGA 


2040 


10 


ACATAGACCT 


AUAJiSk 1 AUiu 


TTACAGTTTT 


TGCTGGGCAA 


GATAAAGAAG 


CAACTGCTAC 


2100 


AATGCGAGAA 


TTCATTCAG C 


AAGCACCATC 


TAGTCCTTCG 


TATGCTTTAT 


TCAAAGGTCA 


2160 




AGATTTAGTT 


TATTTTATGC 


CTAGAGAATT 


TATCGAAGGT 


AGAGATATTA 


ATGACATTGC 


2220 


15 


AATGGACTTA 


AAGGATGCCT 


TTGACGAAAA 


TTGTAAATAG 


TACACATAAA 


TAAATATAAA 


2280 




GGTTAACACA 


TTTTATAATA 


TTAAAAATGG 


TGTCTGTCAT 


TGAAAATAGA 


GAATATAGTT 


2340 




GTATTCTATT 


TGTTAAATAA 


AGTCCGTTTT 


TACCaACTAT 


ATTTTCTAGA 


AATTTAACTG 


2400 


20 


TTTTAATAGG 


ACATCAAACA 


TAATATT CaA 


ATCaTGTGTT 


AACCTCTTTT 


TTAAAATTTT 


2460 




TTAGCATTAA 


AGTTATAGAT 


TTGGGTAAAC 


AATTACCAAT 


TGGAAACATA 


TATCACGTTA 


2520 




CGATGGGGTA 


GGTACTTAAT 


CAGCATTTTA 


TAAATAAAGT 


AACGGAATTC 


ATGATATTAA 


2580 


25 


TATCATATTC 


CTAAAATGAG 


TGATAACAAA 


ATGCTACATA 


AAGTTAAGTT 


ATATCAAACT 


2640 




AAATATACAT 


ACTATAAATA 


ATGAAAATGA 


GGTGTTATCG 


CATATGTTGA 


ATTCATTTGA 


2700 


30 


TGCAGCATAT 


CACAGTCTTT 


GTGAAGAAGT 


TTTAGAAATA 


GGAAATACAC 


GAAATGATCG 


2760 


CACAAATACA 


GGTACGATTT 


CGAAATTTGG 


TCATCAACTT 


CGCTTTGACT 


TATCTAAAGG 


2820 




ATTTCCACTA 


TTAACGACAA 


AGAAAGTTTC 


TTTTAAATTA 


GTAGCAACCG 


AATTATTATG 


2880 


3S 


GTTCATTAAA 


GGAGATAGAA 


ACATCCAATA 


CTTATTAAAA 


TATAATAATA 


ATATATGGAA 


2940 




CGAATGGGCT 


TTTGAAAATT 


ATATCAAATC 


AGACGAGTAT 


AAAGGTCCAG 


ATATGACAGA 


3000 




TTTCDGGCAT 


CGTGCATTGA 


GTGATCCTGA 


ATTTAACGAA 


CAATATAAAG 


AACAAATGAA 


3060 


40 


ACAATTTAAG 


CAACGTATTC 


TTGAAGATGA 


TACATTTGCG 


AAGCAATTCG 


GGGATTTAGG 


3120 




AAATGTTTAT 


GGTAAACAAT 


GGCGAGATTG 


GGTTGATAAA 


GATGGTAATC 


ATTTTGATCA 


3180 




ACTTAAAACA 


GTAATTGAAC 


AAATTAAGCA 


TAATCCAGAT 


TCAAGGCGAC 


ACATCGTATC 


3240 


45 


TGCATGGAAT 


CCAACAGAAA 


TTGATACAAT 


GGCACTTCCG 


CCTTGTCATA 


CCATGTTCCA 


3300 




GTTTTATGTC 


CAAGATGGTA 


AGTTAAGTTG 


CCAGTTATAC 


CAACGTAGCG 


CAGATATCTT 


3360 


SO 


TTTAGGTGTG 


CCATTTAATA TCcGCagctA 


CGCTTTATTG 


ACACACCTTA 


TTGCCAAAGA 


3420 


ATGTGGACTT 


GAAGTGGGTG 


AATTTGTGCA 


TACATTTGGA 


GATGCACATA 


TTTATTCAAA 


3480 




TCATATTGAT 


GCGATTCAAA 


CACAATTAGC 


ACGTGAAAGC 


TTCAATCCTC 


CAACATTAAA 


3540 
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TGAATCACAT 


CCAGCAATAA AAGCTCCAAT 


AGCAGTGTAG 


TCATTGCATA 


GTTAGCTAAC 


3660 




CATATAGACA 


TCAAAATGAC 


ATCATAGTAT 


TTTCAAGTGC 


AAAAAAGTAC 


TTTTTTGTGT 


3720 


5 


TAAACGTTTT 


CATAAATTAT 


GCAAAATCAT 


TATTTCTATC 


ACACTTTArG 


ATAAAAATTG 


3780 




TGTTAAATTA AAGATAACTT AGTAATAAAA AATGAAATGA TAGAAGAAGG AGGATAATTA 


3840 


10 


TGACTTTATC 


CATTCTAGTt 


GCACATGACT 


TGCAACGAGT AATTGGTTTt 


GAAAATGAAT 


3900 


TACCTTGGcA 


CCTACCAAAT 


GATTTGAAGC 


ATGTTAAAAA 


ATTATCAACA 


GGTCATACTT 


3960 




TAGTAATGGG 


TCGTAAGACA 


TTTGAATCGA 


TTGGTAAACC 


ACTACCGAAT 


CGTCGAAATG 


4020 


15 


TTGTACTTAC 


TTCAGATACA 


AGTTTCAACG 


TAGAnGGCGT 


TGATGTAATT 


CACTCTATTG 


4080 




AAGATATTTA 


CCAACTACCG 


GGCCATGTTT 


TCATATTTGG 


AGGGCAAACA 


TTATTTGAAG 


4140 




AAATGATTGA 


TAAAGTGGAC 


GACATGTATA 


TTACTGTTAT 


TGAAGGTAAA 


TTCCGTGGTG 


4200 


20 


ATACGTTCTT TCCACCTTAT mCATTkGAgr 


CTGGGAAGTT 


GCCTCTTCAG 


TTGAAGGTAA 


4260 




ACTAGATGAG 


AAAAATACAA 


TTCCACATAC 


CTTTCTACAT 


TTAATTCGTA 


AAAAATAAGG 






GGGAAAACGA 


CCATGACAAA 


ACAGATTATA 


GTAACAGACT 


CAACATCCGA 


TTTATCTAAA 




25 


GAATACTTAG 


AAGCAAACAA 


CATTCATGTA 


ATTCCTTTAA 


GTTTAACTAT 


TGAAGGAGCT 






TCATACGTTG 


ACCAAGTAGA 


TATTACATCA 


GAAGAATTTA 


TTAATCATAT 


TGAAAATGAT 


a. cnn 


30 


GAAGATGTAA 


AGACAAGTCA 


GCCAGCCATA 


GGTGAATTTA 


TATCTGCTTA 


TGAAGAACTA 




GGAAAAGATG 


GCTCTGAAAT 


CATAAGTATT 


CATCTTTCTT 


CAGGATTAAG 


TGGTACATAT 


4620 




AACACTGCTT 


ACCAAGCAAG 


TCAAATGGTA 


GATGCTAATG 


TAACTGTTAT 


TGATTCAAAA 


AG an 

o o u 


35 


TCTATTTCTT 


TTGGTTTAGG 


GTATCAAATA 


CAACACCTAG 


TAGAGCTTGT 


AAAAgAaGGT 


474 0 




GtCTCAACTT 


CTGAAATAGT 


TAAAAAGTTA 


AATCATTTAA 


GAGAAAACAT 


TAAATTATTT 


4800 




GTAGTTATAG 


GGCAATTGAA 


TCAATTAATT 


AAAGGTGGCA 


GAATTAGTAA 


AACAAAAGGT 


4860 


Ah 


TTGATTGGTA 


ATCTTATGAA 


AATTAAACCA 


ATTGGTACAC 


TAGATGATGG 


TCGCTTAGAG 


4920 




CTTGTGCmCA 


ATGCGAGAAC 


TCaAAATTCk AGTATCCAAT ACTTGAAAAA 


GGAAATTGCT 


4980 




GAATTTATAG 


GAGATCATGA 


AATCAAATCC 


ATTGGTGTCG 


CACATGCTAA 


CGTCATTGAA 


5040 


45 


TATGTTGATA 


AATTGAAGAA 


AGTTTTTAAT 


GAAGCTTTTC 


ATGTGAATAA 


TTACGATATA 


5100 




AATGTAACTA 


CACCAGTTAT 


TTCTGCACAT 


ACTGGTCAAG 


GTGCGATTGG 


CCTCGTAGTC 


5160 




CTTAAGAAGT 


AAATTTAATC 


TTTTCAGTGT 


TAATTACTTC 


CATTTCAATC 


CTTTATAGAC 


5220 


SO 


TAAATTTATA 


ATTAGATAGA 


TAGAGGAGGT 


AATTCATATG 


ACAAAAGAAT 


ATGCAACATT . 


5280 




AG CAGGAGG A 


TGTTTCTGGT 


GCATGGTTAA 


ACCATTTACA 


TCATATCCAG 


GCATCAAGTC 


5340 
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GAATCAAACC GGCCATGTCG AAGCAGTACA AATTACGTTT GATCCAGAGG TTACTTCCTT 5460 

TGAAAATATA TTAGACATAT ATTTCAAAAC ATTTGACCCA ACTGATGATC AAGGGCAATT 5520 

5 

TTTCGATAGA GGCGAAAGCT ATCAACCAGT CATTTTCTAT CATGATGAAC ATCAGAAAAA 5580 

GGCTGCTGAG TTTAAAAAGC AACAATTAAA TGAACAAGGT ATTTTCAAGA AACCAGTGAT 5640 

TACACCTATT AAACCATATA AAAATTTCTA TCCAGCTGAA GACTACCATC AAGATTATTA 5700 

CAAAAAGAAC CCGGTACATT ATTACCAATA TCAACGTGGT TCAGGTAGAA AAGCGTTTAT 5760 

AGAATCACAT TGGGGGAATC AAAATGCTTA AAAAAGATAA AAGTGAACTA ACAGATATAG 5820 

15 AATATATTGT TACACAAGAn AACGGCACTG AACCACCATT TATGAATGAA TATTGGAATC 58 80 

ATTTTGCTAA AGGATTTATG TAGATAAAnT TCnGGTAAAC CTTG 5924 
(2) INFORMATION FOR SEQ ID NO: X31: 

20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9280 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

2S 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 131: 



35 



45 



GGCCGTTnAA AATCTCCAAA ATAnAAAAAC 


CCATCTTGTT 


CCAATGTTTT 


AAAATCGCCa 


60 


TCCaACACTT 


GaTCaATAGC 


TTGCAACAAC 


GTTGAACGTG 


TTTTaCCAAA 


AGCATCaAAC 


120 


GCTCCCACTA 


AAATCAGTGC 


TTCAAGTAAC 


TTTCTCGTTT 


TGACTCTCTT 


CGGTATACGT 


180 


CTAGCAAAAT 


CAAAGAAATC 


TTTAAATTTG 


CCGTTCTGAT 


AACGTTCATC 


AACAATCACT 


240 


TTCACACTTT 


GATAACCAAC 


ACCTTTAATT 


GTACCAATTG 


ATAAATAAAT 


GCCTTCTTGG 


300 


GAAGGTTTAT 


AAAACCAATG 


ACTTTCGTTA 


ATGTTOGGTG 


GCAATATAGT 


GATACCTTGT 


360 


TTTTrrGCTT 


CTTCTAT CAT 


TTGAGCAGTT 


TTCTTCTCAC 


TTCCAATAAC 


ATTACTTAAA 


420 


ATATTTGCGT 


AAAAATAATT 


TGGATAATGG 


ACTTTTAAAA 


AGCTCATAAT 


GTATGCAATT 


480 


TTAGAATAGC 


TGACAGCATG 


TGCTCTAGGA 


AAACCATAAT 


CAGCAAATTT 


CAGAATCAAA 


54 0 


TCAAATATTT 


GCTTACTAAT 


GTCTTCGTGA 


TAACCATTTT 


GCTTTGCACC 


TTCTATAAAA 


600 


TGTTGACGCT 


CACTTTCAAG 


AACAGCTCTA 


rrn-rrriAc 


TCATTGCTCT 


TCTTAAAATA 


660 


TCCGCTTCAC 


CATAACTGAA 


GTTTGCAAAT 


GTGCTCG CT A 


TTTGCATAAT 


TTGCTCTTGA 


720 


TAAATAATAA 


CACCGTAAGT 


atittttaat 


ATAGGTTCTA 


AATGCGGATG 


TAAATATTGA 


780 


ACTTTGCTTG 


GATCATGTCT 


TCTTGTAATG 


TAAGTTGGAA 


TTTCTTCCAT 


TGGACCTGGT 


840 
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ACACTTCTTA 


CACCGTCAGA 


CTCTAATTGG 


AATATGCCAG 


TCGTATCTCC 


TTGCGACAAC 


960 




AATTCAAACA 


CTTTTTGATC 


ATCAAACGGA 


ATCTTTTCGA 


TATCAATATT 


AATACCTAAA 


1020 


5 


TCTTTTTTGA 


CTTGTGTTAA 


GATTTGATGA 


ATAATCGATA 


AGTTTCTCAA 


CCCTAGAAAA 


1080 




TCTATTTTTA ATAACCCAAT 


ACGTTCGGCT 


TCAGTCATTG 


TCCATTGCGT 


TAATAATCCT 


1140 




GTATCCCCTT 


TCGTTAAAGG 


GGCATATTCA 


TATAATGGAT 


GGTCATTAAT 


AATAATTCCT 


1200 


10 


GCCGCATGTG 


TAGATGTATG 


TCTTGGTAAA 


CCTTCTAACT 


TTTTACAAAT 


ACTGAACCAG 


1260 




CGTTCATGTC 


GATGGTTTCG 


ATGTACAAAC 


TCTTTAAAAT 


CGTCAATTTG 


ATATGCTTCA 


1320 


15 


TCAAGTGTAA 


TTCCTAATTT 


ATGTGGGATT 


AAACTTGAAA 


TTTCATTTAA 


TGTAACTTCA 


1380 


TCAAACCCCA 


TAATTCTTCC 


AACATCTCTA 


GCAACTGCTC 


TTGCAAGCAG 


ATGACCOAAA 


1440 




GTCACAATTC 


CAGATACATG 


TAGCTCG CCA 


TATTTTTCTT 


GGACGTACTG 


AATGACCCTT 


1500 


20 


TCTCGGCGTG 


TATCTTCAAA 


GTCAATATCA 


ATATCAGGCA 


TTGTTACACG 


TTCTGGGTTT 


1560 




AAAAAACGTT 


CAAATAATAG 


ATTGAATTTA 


ATAGGATCAA 


TCGTTGTAAT 


TCCCAATAAA 


1620 




TAACTGACCA 


GTGAGCCAGC 


TGAAGAACCA 


CGACCAGGAC 


CTACCATCAC 


ATCATTCGTT 


1680 


25 


TTCGCATAAT 


GGATTAAATC 


ACTTACTATT 


AAGAAATAAT 


CTTCAAAACC 


CATATTAGTA 


1740 




ATAACTTTAT 


ACTCATATTT 


CAATCGCTCT 


AAATAGACGT 


CATAATTAAG 


TTCTAATTTT 


1800 




TTCAATTGTG 


TAACTAAGAC 


ACGCCACAAA 


tattttttag 


CTGATTCATC 


ATTAGGTGTC 


1860 


30 


TCATATTGAG 


GAAGTAGAGA 


TTGATGATAT 


TTTAATTCTG 


CATCACACTT 


TTGAGCTATA 


1920 




ACATCAACCT 


GCG TTAAATA 


TTCTTGGTTA 


ATATCTAATT 


GATTAATTTC 


CTTTTCAGTT 


1980 




AAAAAATGTG 


CACCAAAATC 


TTCTTGATCA 


TGAATTAAGT 


CTAATTTTGT 


ATTGTCTCTA 


2040 


35 


ATAGCTGCTA 


ATGCAGAAAT 


CGTATCGGCA 


TCTTGACGTG 


TTTGGTAACA 


AACATtTTGA 


2100 




ATCCAAACAT 


GTTTTCTACC 


TTGAATCGAA 


ATACTAAGGT 


GGTCCATATA 


TGTGTCATTA 


2160 


AO 


TGGGTTTCAA 


ACACTTGTAC 


AATATCACGA 


TGTTGATCAC 


cgactitttt 


AAAAATGATA 


2220 


ATCATATTGT 


TAGAAAATCG 


TTTTAATAAT 


TCAAACGACA 


CATGTTCTAA 


TGCATTCATT 


2280 




TTTATTTCCG 


ATGATAGTTG 


ATACAAATCT 


TTTAATCCAT 


CATTATTTTT 


AGCTAGAACA 


2340 


AC 


ACTGTTTCGA 


CTGTATTTAA 


TCCATTTGTC 


ACATATATTG 


TCATACCAAA AATCGGTTTA 


2400 




ATGTTATTTG 


CTATACATGC 


ATCATAAAAT 


TTAGGAAAAC 


CATACAATAC 


ATTGGTGTCA 


2460 




GTTATGGCAA 


GTGCATCAAC 


ATTTTCAGAC ACAGCAAGTC TTACgG CATC TTCTATTTTT 


2520 


60 


AAGCTTGAAT 


TTAACAAATC 


ATAAGCCGTA 


TGAATATTTA 


AATATGCCAC 


CATGATTGAA 


2580 




TGGCCCCTTT 


CTATTAGTTA 


AGTTTTGTGC 


GTAAAGCTGT 


AGCAAGTTGC 


TCAAATTCAT 


2640 
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CAATATCATT 


AATAATCAAT 


TGCCCTTTAG 


AACGTAATOG 


ACATCTGATT 


TCATTACCTT 


2760 




CATCGACTGC 


AAATACCCAT 


ATTTTCAAGC 


CTTTGATGTC 


AGCAATTGTA 


TTAACAAACT 


2620 


5 


GAGATGCTTC 


ATTTGGCTGA 


ATACCGAATT 


GCTCCAATAC 


ATCTTCAGTT 


ATTTTAACTT 


28B0 




GGCAGAATCC 


ATCATCCATA 


AGTTCGAAAT 


GTTGTAAAAC 


ATAACCTTGA AACGGCAACA 


2940 


10 


TTTTTOGGTC 


CTTCTCCATC 


ATTTTATTTA 


AAAGCGCATT 


ATGATCAATA 


TCATGCCCAA 


3000 


TTAACTTTCC AGCAATTTCC 


ATAGTATGTT 


CTGAGGTATT 


GTTAAAAAGG 


AATCG CCCAG 


3060 




TATCACCGAC 


GATACCAAGA 


TATAAAACGC 


TCGCGATATC 


TTTATTAACA 


ATTGCTTCAT 


3120 


15 


CATTAAAATG 


TGAGATTAAA 


TCGTAAATGA 


TTTCACTTGT 


AG ATGACG CG 


TTCGTATTAA 


3160 




CTAAATTAAT 


ATCACCATAC 


TGATCAACTG 


CAGGATGATG ATCTATTTTA 


ATAAGTTTAC 


3240 




GACCTGTACT 


ATAACGTTCA 


TCGTCAATTC 


GTGGAGCATT 


GGCAGTATCA 


CATACAATTA 


3300 


20 


CAAGCGCATC 


TTGATATGTT 


TTATCATCAA 


TGTTATCTAA 


CTCTCCAATA 


AAACTTAATG 


3360 




ATGATTCCGC 


TTCACCCACT 


GCAAATACTT 


GCTTTTGCGG 


AAATTTCTGC 


TGAATATAGT 


3420 




ATTTTAAACC 


AAGTTGTGAA 


CCATATGCAT 


CAGGATCTGG 


TCTAACATGT 


CTGTGTATAA 


3480 


25 


TAATTGTATC 


GTTGTCTTCG 


ATACATTTCA 


TAATTTCATT 


CAAAGTACTA 


ATCATTTTCA 


3540 




TACTCCCTTT 


TTTAGAAAAG 


TTGCTTAATT 


TAAGCATTAG 


TCTATATCAA 


AATATCTAAA 


3600 




TTATAAAAAT 


TGTTACTACC 


ATATTAAACT 


ATTTG CCCGT 


TTTAATTATT 


TAGATATATA 


3660 


30 


TATTTTCATA 


CTATTTAGTT 


CAGGGGCCCC 


AACACAGAGA 


AATTGGACCC 


CTAATTTCTA 


3720 




CAAACAATGC 


aAGTTGGGGT 


GGGGCCCCAA 


CGTTTGTGCG 


AAATCTATCT 


TATG CCTATT 


3780 


35 


TTC'ICTGCTA 


AGTTCCTATA 


CTTCGTCAAA 


CATTTGG CAT 


AT CACGAGAG 


CGCTCGCTAC 


3840 


TTTGTCGTTT 


TGACTATGCA 


TGTTCACTTC 


TATTTTGGCG 


AAGTTTCTTC 


CGACGTCTAG 


3900 




TATGCCAAAG 


CX3CACTGTTA 


TATGTGATTC 


AATAGGTACT 


GTTTTAATAT 


ACACGATATT 


3960 


40 


TAAGTTCTCT 


ATCATGACAT 


TACCTTTTTT 


AAATTTACGC 


ATTTCATATT 


GTATTGTTTC 


4020 




TTCTATAATA 


CTTACAAATG 


CCGCTTTACT 


TACTGTTCCG 


TAATGATTGA 


TTAAAAGTGG 


4080 




TGAAACTTCT 


ACTGTAATTC 


CATCTTGATT 


CATTGTTATA 


TATTTGGCGA 


TTTGATCGTT 


4140 


45 


AATTGTTTCA 


CCCATCTGAG 


GCTGTCTTCC 


TAAAAGTTGC 


ATAGACTTTA 


AAACATCTTG 


4200 




TCTATTAATC 


ACACCCACTG 


TCTTTTTATT 


ACTCGAAACG 


ACAGGAATCA 


ATTCAATACC 


4260 




TTCCCAAATC 


ATCATATGCG 


CACAACTTGC 


TACTGTACTC 


ATAGCATTTA 


CATAAATAGG 


4320 


60 


ATTTCGCGTC 


ATCACTTTAT 


CTATTTCGTC 


GTCGTCCTTT 


GTATTAATCA 


TCTCTCGACT 


4380 




TGTTACAATA 


CCTACTAATT 


TATACGACTC 


ATTGACTACC 


GGAAATCTTG 


TATGGCCAGT 


4440 
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ATCTAATGGC 


GTCATTATAT 


CTTGAACTAT 


TAAGATATCT 


TTTCGTATTT 


TCTGATTAAA 


4S60 




AAGTGCTTTG 


TTGATAATAT 


TTGCAACTAG 


GAATGTATCA TAACTTGATG ATAGAACAGG 


4620 


5 


TAAATCATGT 


TCATTCGCAA AATTAATAAC 


TTTATTAGAT 


GGCTTAAATC 


CACCAGTAAT 


4680 




TAATATAGCC 


GTACCTCTTT 


TTAAAGCTTC 


AATCTGCACA 


TCTTCACGAT 


TTCCGACAAT 


4740 




CAATAATGTC 


TTTGGACCAA 


TATACTTTAA 


AATATCTTTG 


AGTTCCATTG 


CTCCAATTGC 


4800 


10 


AAATTTAGAT 


ACCATCTTAG 


TGATACCTTT 


GTTGCCACCT 


AACACTTGGC 


CATCAATAAT 


4860 




ATTGACAATT 


TCATTAAAAG 


TTAAATGTTC 


AATTTCATTA 


CGATTACGTT 


TTTCGATTCG 


4920 


15 


AACCGTACCA ACACGATCTA 


TCGTTGCGAC 


CATGCCCATT 


TTATCAGCAT 


CTTTmATTGc 


4980 


ACGATATGCT GTCCCytCaG ATACGTTTAA AAATTTAGCG ATTTTACGCA CCGAAATTTT 


5040 




AGAGCCTATA 


GATAACGATT 


CAATATAATC 


TAAAATTTGT 


TCATGTTTTG 


TCATTCTTTA 


5100 


20 


CCTCTTCTTT 


TCGAACAGTA 


TTAACTACAT 


XATAACTTXA 


TTTTGGATAA 


AAAGCATTGA 


5160 




AGTGAAATGA 


AATAATGATC 


GTTtCACCTA 


TTTTATTTTT 


TGAAAATATA 


CAACAAACAC 


5220 




AAAGATCACA 


AAATCTTTAA 


TTTTAAATGG 


AAAAATCCAT 


TATTATTTAT 


TAGAATGTAA 


5280 


25 


GTGAGGAGGG 


ATGTACTAAT 


GTATAAAAAT 


ATATTACTTG 


GTGTAGACAC 


TCAGTTAAAA 


5340 




AATGAAAAAG 


CACTAAAAGA 


AGTGTCTAAA 


TTAGCTGGCG 


AAGGTACAGT 


CGTAACAGTT 


5400 




TTAAACGCAA 


TCAGCGAACA 


AGaTGCTCAA 


GCATCAATTA 


AAGCAGGTGT 


TCATTTAAAC 


5460 


30 


AAACTTACTG 


AAGAACGAAG 


CAAGCGATTG 


GAAAAAACAC 


GCAAAGCTTT AGAAGATTAT 


5520 




GGTATTGATT 


ATGACCAAAT 


AATTGITCGT 


GGTAATGCAA 


AAGAAGAACT 


ATTAAAACAT 


5580 




GCTAATAGCG 


GTAAATATGA 


AATTGTTGTT 


TTAAGTAACC 


GTAAAGCAGA 


AGACAAAAAG 


5640 


35 


AAATTTGTAC 


TTGGAAGTGT 


CAGCCACAAA 


GTAGCAAAAC 


GTGCGACTAT CCCTGTATTA 


5700 




ATCQJTAAAT AAAATTTTTA TCCAGAATCA 


CAAATAATCT 


TTCAATCATG 


ATGCAGTCTC 


5760 


40 


AAACGACTGA 


GTAAATACAA 


GAAACGATTA 


TGACTGTGGT 


TCTGGATTTT 


TTATATCGTA 


5820 


GTAAATTTAT 


AATCAATGTC 


TAATTGTATA 


AAACT AAAAT 


TACGAGAGTA 


GGTCAGAAAT 


5880 




GATAAAGAAC 


CACTGATGTC 


CCCCGTCCAC 


GTCGTAACTG 


AATCAGTAGA 


ATATAAAAAC 


5940 


45 


ACCCACTAAA 


AATATGCAGA 


CGATAACTTC 


CACATAGATT 


AGCGAGGTGT 


TTTTTAGTGT 


6000 




AAAAT CT AT A 


TTCTATTTAA 


AACTGAACAG 


ATTCACCTGG 


TTTTAAAATT 


TGCACGTCCC 


6060 




CTACATTAAC 


AGCATCTTTA 


AATTGTTGTG 


GATCTTGTTC 


GATTAATGGG 


AATGTATCAT 


6120 


50 


AATGAATCGG 


TACAGAAATT 


TTTGGTTTAA 


TAAATTCATT 


AATAGCATAA 


CTTGCATCAT 


6180 




CAATACCCAT 


CGTAAAATTA 


TCTCCAATTG 


GTACAAAACA 


TACATCAACT 


GGATGACGTT 


6240 
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TTCAACTTCA AACACGATAC CCATTGGCAT ACCTAAATAA ACTGGgAATA CCATTTTCAT 
GTGTAAAACT TGAACTATGA AATQCTTGAA CAAATTTAAC GCTTCCGAAA TCAAaGTTTG 
CTTTACCACC AaTATTCATA CCATGAACAT TTTCAACACC GTGATATGAA GAAAGATAGT 
CAGCCATTTC TGCACTTCCA ATTACTGTTG CTCCTGTTTT CTTTGCTAGT TCCACAACAT 
CACCAAAATG ATCAAAATGA CCGTGCGTTA AAACGATATA GTCTACCTGC ACTGTTTCAA 
TATTCAAATC ACACTTAGGG TTATTTGAAA TAAACGGATC TACGATAACC TTTTTGTTGT 
TCCCTTCTAA ATAAATCGTT GATTOACCAT GAAATGATAA CTTCATTTGA GCATCCTCCT 
ATCAATTACT ATATAAATTT AGTACCCTTT TGCCACTTAA TTATAACAAA TTCTCAAATT 
TTAAAAATTG AAAAT CTAGT TAATGTATTA GCTCGATTTT GAAATCTAAT AATAATTGGC 
ATAAAATGGA AGTAATATTA TGTTGAGGAG TGTTTATAAA ATGACAAAAA TATCAAAAAT 
AATAGACGAA TTGAACAATC AACAAGCTGA TGCAGCATGG ATTACAACAC CGTTGAATGT 
ATATTATTTT ACTGGATACC GTAGCGAACC CCATGAAAGA TTATTTGCAT TATTGATTAA 
GAAAGATGGT AAACAAGTAC TATTTTGTCC AAAAATGGAA GTCGAAGAAG TCAAAGCATC 
ACCTTTCACA GGTGAAATCG TTGGATATTT AGACACTGAA AACCCTTTTT CACTTTATCC 
TCAAACAATC AATAAATTAC TAATTGAAAG CGAGCACTTA ACAGTAGCAC GCCAAAAACA 
ATTAATCTCT GGTTTCAATG TCAATTCATT CGGAGATGTT GATTTAACAA TCAAACAATT 
GAGAAATATT AAATCCGAAG ATGAAATTAG CAAAATACGT AAAGCTGCTG AGTTAGCAGA 
TAAGTGTATC GAAATAGGTG TTTCTTATTT AAAAGAAGGT GTGACTGAAT GTGAAGTAGT 
CAACCATATT GAGCAAACTA TCAAACAATA TGGCGTCAAT GAAATGAGTT TTGATACGAT 
GGTTTTATTT GGAGATCATG CCGCATCACC TCATGGCACA CCAGGAGATC G CAG ATT AAA 
AAGCAATGAA TATGTACTAT TTGATTTAGG TGTAATTTAT GAGCATTATT GTAGCGATAT 
GACACGTACT ATTAAATTTG GTGAACCTAG CAAAGAAGCA CAAGAAATTT ATAATATTGT 
ATTAGAAGCA GAAACATCTG CAATCCAAGC AATTAAACCT GGAATACCAT TAAAAGATAT 
CGATCATATC GCTAGAAATA TTATTTCAGA AAAAGGTTAT GGTGAATATT TCCCTCATCG 
CTTAGGTCAT GGCCTAGGAT TACAAGAACA TGAATATCAA GATGTTTCAA GTACTAATTC 
TAATTTGTTA GAAGCTGGCA TGG TTATT AC AATCGAACCA GGTATTTATG TACCTGGTGT 
TGCAGGTGTA AGAATTGAAG ATGACATACT TGTCACTAAT GAAGGATATG AAGTATTAAC 
ACATTACGAA AAATAAGGAG TGGGATAAAA ATGAAAAGCT TGTTACAAGC G CATTCT CAT 
TCAGTCAAAC ACTGCCAATA TAACATTGTA GCGCCTAAGA CATAAATTTT TATCCAAGTC 
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TGTAATGAAT CAAATCAATA TCATTCATGT TCGATGATTT CTTCGCATTG TTTCTAGCTT 8160 

TAATTTATCA TTATTTAATT TTAATAACCA AGGAGATGAT AACGTCATTC TTTAGTACGC 8220 

TGTAATCCAT TCCCTTTTCA TCAAATTCAA ATTATAATTG TAATGCTTCT TCTACAGATT 8280 

TATATTCCAT TTCAAATGCC TCTGCAACGC CTTTATTGGT TACGTGACCT TTGTAAGTAT 8340 

TTAAACCTAA TGATAATGGT TGATTTGATT TAAATGCTTC TCTATACCCT TTATTAGCTA 8400 

GCATGAGCGC ATAAGGTAGC OTAgCATTAT TTAAAGCTAA CGTCGAAGTA CGCGGTACTG 8460 

CACCTGGCAT ATTTGCAACT GCATAATGAA CCACACCATG CTTAATATAT GTAGGATCAT 8520 

CATGTGTCGT AATTTTATCA GTTGtTTCAA AAATACCGCC TTGATCAATA GCAATGTCAA 8580 

TAATAACTGA CCCATTTTTC ATTTGTTTAA TCATGTCTTC TGTTACAAGT CTTGGCGCTT 8640 

TAGCACCTGG AATTAAAACT GCACCTATTA CTAAATCACT TTGTTTAACA TACAACTCAA 8700 

TATTCAACGG ATTTGACATA ATTGTATGTA CACGTCCACC GAATAAATCA TCTAATTGTT 8760 

GTAAACGCTT TGGATTAACA TCTAAAATCG TAACATCTGC ACCTAGTCCT AGTGCAATTT 8820 

TAGCTGCATT TGTTCCTGCT TGACCACCAC CGATAATAGT TACTTTACCC TTAGGTACTC 8880 

25 CTGGGACACC ACCTAGTAGA ATTCCCATAC CACCATTAAG TTTTTGTAGG AACTCTGCGC 8940 

CAACTTGAGC TGACATTCTT CCTGCTACCT CACTCATTGG TGATAACAAT GGTAAAGATC 90 00 

GGTCTGGTAA CTGCACAGTC TCATATGCAA TACTAATTAC TTTTCTATCT ATCAAAGCTT 9060 

30 GTGTTAATTT TTCTTCATTT GCTAAATGAa gatAaGTGAA TAATACAAGC CCTTCTTTAA 9X20 

AATATGGATA TTCAGATTCA AGTGGTTCTT TAACTTTAAT AAC CATATCC ACATCCCAAA 9180 

CTIVTGCTTG TTCAGCAACA ATCTCAG CAG CTGCTTCTTT GTAATCTACA TCTTCAAAGA 9240 

35 ATGATCCTGA ACCCGcATTT GTTTCCACTA AAACAGTATG 92 80 

(2) INFORMATION FOR SEQ ID NO: 132: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 4669 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 132: 

CTGATTAATC TCTTGTTGTC GTGTATTTAC TAATTGAATC GTTGGTGTCT GAACACGTCC 60 

50 CAGGGATAGC TGTGCATCAT ACTTTGTTGT TAGTGCACGC GTTGCATTAA TCCCAACAAT 120 

CCAATCTGCC TCACTTCTCG CTAACGCTGC ATAATACAAA TCGTTATATT GACGACCGTC 180 
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ACGGATTGGC TTTTTGTTAC CAACTTTATC CAAAATCAAT CTTGCAACTA GTTCACCTTC 
TCGTCCaGCA TCTGTTGCAA TAATAATATC TTTCACTTTA TTATCTAAAA TTAACGCTTT 

TACTGTTTTA AATTGTTTGC TTGTTTTACC AATAACAACA GTTTTCATAT ATTTAGGTAT 420 

AATTGGAAGG TCTTCTAATC GCCATTCCTT TAAATTT T TA TCGTATTGTT CAGGTGTCGC 480 

ATTTGTCACT AGATGACCTA ACGCCCACGT GACAATATAT TGGTTATTTT CAAAGTAACC 540 

ATTACGCTTC TGATTTATTT GTAAAGCATC AGCAATATCT CTTGCGACTG ATGGTTTTTC 600 

AGCTAATATT AAAGATTTCA TAAATTATCC TTTCTCATAC GTTCTTTTAT TTCGAAOGTG 660 

CTTCATCTAT TCCACTAATC TTTGATTTAA ATTCAATGAT TGCAAATGAT GTGTTAAATG 720 

TATTGTAACA TGTTAATATC ACTATTAACT TTCATTTCAG TTGAAATACT ATATAATAAA 7B0 

AGTAACAAAA AGTACGGAGG TAATGACATG AGCATAGTTC AGTTATATGA TATTACACAA 640 

ATAAAATCGT TCATTGAACA TTCGAATTAT GAATCAGCAT CATACTTATA TAAACTTCCT 900 

CAACAGTACA ATGAAATAGA TGTATTAATA ACCGATGCGA TTGAATCACC TGGTGTATTT 960 

TCGATTAAAG AAAACGATTC AATCAAAGCA ATCATATTGT CTTTTGCATA CGATAAAAAT 1020 

25 AAATTCAAAG TCATAGGCCC TTTCGTGGCT GACAATTATG TATTATCTGT CGATACGTTT 1080 

GAAACGCTAT TTAAAGCAAT GACTTCGAAC CAACCTGACG ATGCCGTCTT TAACTTTTCT 1140 

TTTGAAGAAG GCATTCAACA ATACAAACCA TTAATGAAAG TTATTCAAGC AAGTTATAAC 1200 

30 TTCACTGACT ATTACA TAGA AGCCCGTACA AGATTAGAAG AAGATATGCA CCAACCAAAT 1260 

ATCATTCCTT ATCACAAAGG GTTTTATCGT GCTTTCAGCA AATTACACAC AACTACATTT 1320 

AAATATGAGG CACAGTCACC ACAAGATATC ATTGATAGTT TAGACGACCA TCATCATTTG 13 80 

TTTTTATTTG TTAGCGAAGG TTTACTTAAA GGTTATTTAT ACCTTGAAAT TGATTCACAA 144 0 

CAGTCAATCG CCGAGATTAA ATACTTCAGT TCTCATGTAG ATTACCGTTT GAAAGGTATC 1500 

GCTTTCGAGT TGCTTGCGTA TGCATTGCAA TATGCTTTTG ATAATTTTGA TATTAGAAAA 1560 

GTTTATTTTA AAATTCGTAA TAAAAATAAT AAACTCATCG AACGATTTAA TGGTCTAGGT 1620 

TTCCATATCA ACTATGAGTA CATTAAATTC AAATTCGAAT CACGTAACGT AAAAGATCAA 1680 

ACAATCCCTG AATAAAACAC CAAGCAAATA CCCTACAGTA CATCATTAGC ATGTATTGTG 1740 

GGTTTTTCTA CTTTTTGTAA ATATTGAAAA TTATAAGTAG TTGTTTTTTA CTATTAGGGC 1800 

AGAATGCTTT ACAATAACAT GCAAGTGTCA ATTAAGGGGA G CACTTG CAT AAATAGTATA I860 

SO GGAGAGTGAG TAGTCTTGCA ATTTCTTGAT TTCTTAATCG CACTTTTACC TGCTTTATTC 1920 

TGGGGAAGTG TCGTTCTTAT TAATGTGTTC GTCGGCGGTG GACCTTACAA CCAAATTCGT 1980 
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TTCAATAATC 


CTACTGTAAT 


TATTGTCGGT 


CTTATTTCTG 


GTGCATTATG 


GGCGTTTGGA 


2100 




CAAGCGAATC 


AGCTTAAATC 


TATTAGTTTA 


ATCGGTGTAT 


CAAATACTAT 


GCCAGTTTCT 


2160 


5 


ACAGGTATGC 


AATTAGTTGG 


TACAACATTA 


TTCAGCGTTA 


TCTTTTTAGG 


TGAATGGTCT 


2220 




TCAATGACTC 


AAATTATCTT 


TGGTTTAATC 


GCCATGATAT 


TATTAGTTAC 


TGGTGTAGCA 


2280 


10 


CTTACTTCAC 


TTAAAGCTAA 


AAATGAACGT 


CAATCAGATA 


ATCCTGAATT 


TAAAAAAGCA 


2340 


ATGGGTATTT 


TAATTGTATC 


TACAGTTGGA 


TATGTAGGTT 


TCGTTGTACT 


TGGTGACATC 


2400 




TTTGGTGTTG 


GTGGAACTGA 


TGCATTGTTC 


TTCCAATCTG 


TCGGTATGGC 


AATTGGTGGC 


2460 


1$ 


TTTATCCTAT 


CCATGAATCA 


TAAAACATCA 


CTTAAATCAA 


CAGCACTTAA 


TCTATTGcCA 


2520 




GGTGTQATTT 


GGGGAATTGG 


TAACTTGTTC 


ATGTTCTATT 


CTCAACCAAA 


AGTTGGTGTA 


2580 




GCTACAAGTT 


TCTCATTATC 


ACAGTTACTT 


GTTATCGTTT 


CAACCTTAGG 


CGGTATTTTC 


2640 




ATTTTAGGAG 


AAAGAAAAGA 


TCGTCGTCAG 


ATGACGGGTA 


TTTGGGCAGG 


TATTATTATT 


2700 




ATCGTGATAG 


CTG CTATAAT 


TCT AGGTAAT 


TTGAAATAGA 


AAGTTAAATA 


CTCATGTAAC 


2760 




GTAAAAATGT 


AATCACTTCT 


GAAAATAACC 


ATTCACTTAT 


AGAATGATTA 


AAATTAATTT 


2820 


25 


TCGGGAATTT 


TACGTTGAAT 


GTTCCTCTAT 


ATGTCCTAGG 


AAATACGTGG 


CTCTAAAAAC 


2880 




AAAAfYSCAAT 


AACACATCAT 


GACATTAATC 


ATGCGTTTTA 


AGACTTTAAA 


ATTAGCGATA 


2940 




r -i-j\A A. A. AT 

V* XXX iATWW A 


CTTGATGATA 


TTCATATATC 


AAGTATGCGC 


CATACATATG 


AAGTGGATAG 


3000 


30 


CTGCATAACG 


CACTGCATTA 


TCAACTTGAA 


TGTATGAGTT 


GAACAACTAT 


GTCATAAATA 


3 060 




AAAG CCCCCT 


TTTCACAATA 


TACATTTACA 


TATTGTGGTA 


AAGGGGGCTC 


TCATTTTCTA 


3120 


35 


CGAATACTAA 


AATGGATTTT 


ATTTTCAAAT 


GTGTAAACTA 


GACAAACACT 


GCCTGATACA 


3180 


CGTACAAAAT 


AATGATACTA 


ATAATGATTG 


TCAAATTGGT 


CGTCATACCT 


ATAAATGGCA 


3240 




GTGTTCGATA 


TTTAAACTGA 


ATACCATAAG 


AAATAATTGC 


AACACcTACC 


GGGAACATCC 


3300 


40 


AAGTGACCAA 


CAATGTCGTC 


TTAATCATAT 


CATCTGATAC 


TGGTAACAAG 


ACATATACTA 


3360 


ACAATCCCGC 


AACTAATGCT 


AATCCATAAT 


GCAAACATAA 


ATATTTAATA 


GTAGCAGGTA 


3420 




TATACTTTCT 


TTCCAGAGTA 


AAATTCAACA 


TGACACCTAG 


CAAAATCATT 


GATAACGGCA 


3480 


45 


TATTTGCATG 


GGAAACjTAI t» 


V*. XnAAoAAAl 


fY2 a Trace tr 


ATGTGGTAAA 


TGGATGTGAC* 


3540 




TTATATTCAA 


TATAAACATT 


ACAATGTATG 


TAACGAGTGG 


CACTGATTGT 


AATAATTTCT 


3600 




TACCTAAATA 


TTTAAAATCG 


AATTGATCAC 


TACCTTCACT 


AAAGTAGCTA 


CCTACAAAGT 


3660 


SO 


AAGTAATTCC 


AAACATCACA 


AAGGCACCAC 


CTATATCAGC 


CATAACAAAA 


TAAATAAGTC 


3720 




CCGTTTTAGG 


CCATATCACT 


TCAATTAGTG 


GATATGCAAA 


CAATCCAATA 


TTCATAGCAC 


3780 
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CAATCATTTT CGCCACAATA CCATATATAA TCATTAAAAT TGGTAAAATG GAGAATOACA 3900 

ATTTTAATTC TGCACTGTTT AAATTCACAA TAACTAAAGA TGGOAGTGTG ACATTAAGAA 3960 

CTAATGTAGC AATGACTTGA CTATCTGTTG CTTTTATAAA ATTAATGCGC TTCAAAAAGT 4020 

AACCAAGCGC AATTAATAAA ATAATCATAG TAAATTGTTC TGTCACTGTT ATCCCTTCTT 4080 

TCAATAATCT TCATAATTTA TAACTTTAAC ATACTCCACA GATATTTTAG AAGTCTACTG 414 0 

TTTCATGCTA TAATCTACAT TAAATGCACT TAATTATATT TCAAAGGAGT GTTATAGTAT 4200 

GTCTTTAGAA AACCAACTAG CCGAACTTAA ATATGATTAT GTTCGTCTTC AAGGTGACAT 4260 

AGAAAAACGG GAATCTTTGA ATTTAGATAC TTCCGCACTT GTTCGTCAAC TTAAAGATAT 4320 

TGAAAATGAA ATTAGAAACG TTCGTGCTCA AATGCAAGAT TAATAATCTA TCATTCAAGC 4380 

AATAAATGCT TTTTGTTACA TAAATTTGAC TAGCATTGCT CTGAATACGT TATATTGATG 4440 

2Q AATTGCTTCA TTTTTCGCTC AATTACATCT AGAATCACAA GATGTTGTCG TGTTATGATT 4500 

TAGTGTTTCA TTAACAACAT ACACGCATAT CTATCCCAAC ACTGCTATTT ATGTTTTCTA 4560 

CGCTGnTGTA CTACATGAAC CCTTTGAAAC GGAGAGGAAG TTATCATATG CAATTTTAnC 4620 

2s TGATTTTACT AGCAATACTT TAACnAATTG nTAGTTTAAT AGAATTTTA 4 669 

<2) INFORMATION FOR SEQ ID NO: 133: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2785 base pairs 
30 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



10 



16 



35 



40 



45 



50 



Cxi). SEQUENCE DESCRIPTION: SEQ ID NO: 133: 

TTTOCACCCA TCTGaTACAA TGCACCATGC GGTTTAACAT GATTAATTTT AACTTGATGA 60 

ATGCGACAAA ACCCTTGTAA TGCACCTAAT TGATAAATCA TCAAATTATA AATCTCGTCG 120 

TTAGAGATAT CTATATTTCG TCTGCCAAAG CCTTTCAAAT CAGGTAAACC AGGATGTGCA 1B0 

CCTACTGCAA CATTATGTGC TTTGGCAAGT TTTACCGTTT CATTCATTAC ATTTTCATCA 24 0 

CCAGCGTGAA AACCACAAGC AACATTCGCA CTTGTAATTA ACGGAATAAT TTGATGATCA 300 

CCACCAAAGG AATAATTTCC AAATGCTTCG CCTAAATCAC AATTCAAATC AACTCGCATT 360 

ATAATTCCAC CCCTTTAACA ATTTGATGTT TTTCTAAAAA TTTAATATCA ACATCTTTTG 420 

CATCTCCATC ACGATATAGT GGATAATTTA AAACTGCATA TAAAAAATCG GCAGTTGTAG 480 

AAAATCCATC TATCACCATT TCATCTAAGG TGACTTTCAA CTTATCAATT GCTGAAGCTC 540 
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AACCGTOATA TAGTAAAGAA TCGACTCGCA CATTAAAGCC TTGAGGTAAA TGTAACGCTG 


€60 




TCACTTTACC TGGTGTTGGT 


TGAAATTTCT 


' TTTCaGGATT TTCGGCATTT 


' ATTCTCGCTT 


720 


s 


CTATCACATG ACCATTAAAT 


TGAATATCGC TTTGTGAAAA AGGTAAATGA TTATGTTCCA 


780 




ATAAATACAG TTGTGCTGCA 


ACCAAATCAC 


GTTCTGCTCG CATCTCTGTA ACAGTATGTT 


84 0 


10 


CAACTTGTAT TCGAGCATTC 


ATTTCAATAA AGTAATGTGC GGTATCAGTT 


ACTAAAAATT 


900 


CAATCGTACC TGCACTTCTA 


TAATTTGCTG 


CACGTGCAAC TTTAACAGCA 


TCGTTACATA 


960 




TTTGTTGTCG TCTTTCTTCA 


GTTAATGCTG 


CACAAGGAGA TTCTTCGATT 


AATTTTTGAT 


1020 


15 


TTTTACGTTG TACAGAACAA 


TCACGTTCCC 


CTAAATGTAC ATAATTATCC 


TGCCCATCTC 


1080 




CCaTAACTTG AACTTCAACA 


TGTTTTGcAA 


CAGGTATAAA AGCCTCAACA 


TAAACACGAT 


1140 




CATCATCAAA GTATTTTTTT 


CCTTCACTTT 


TAGL-ri'ci-rr aaatgccttt 


TCTAAATCTT 


1 5flft 


20 


CAGCTTTCTT TACAATACGT 


ATACCTTTAC 


CACCACCGCC ACTGGCAGCT 


TTGATAACAA 


i 5cn 




CTGGATAACC GATGTCTTTG 


GCAAGATTCT 


CAATTTCAGA cacatgattc 


ACAGCACCAT 


IJ^U 




TTGATCCTGG AATCACAGGA 


ACACCTGCAT 


GATGAACTGT TTGTCTTGCT 


GTTATTTTAT 




25 


CCCCCATCAT TTCCATCGTT 


TTTTTAGTAG 


GCCCTATAAA cgctatgcct 


TGTTCCTCAA 


T A A f\ 

144U 




CGGTTTGAGC AAATTTTGTT 


GATTCTGATA 


aaaagccata tcctgggtga 


ATTGCATTAG 


1500 




CACCAGTGAT TTGTGCAGCA 


GATATGATGC 


GGTCAATATT TAAATAACTA TCTAAAgCAT 


1560 


30 


TArcwTCCCC AATACATATA 


GCTTGATCTG 


CTAAATGTAC ATGCAAGCTT 


TGCTCGTCCC 


T C *5 f\ 




cttttgcata aactgctaca 


GTTTCAATCC 


CATATTCTCT GCAAGCTCTT 


ATAATCCTTA 


1 CO f\ 


35 


CAGCAATTTC ACCTCTGTTC 


GCAATTAAAC 


AACGAAGCAT TTACTTACCC 


CCTTTACTTA 


X / *% v 


ATACGTACCA aaacttggtc 


GTATTCAACA 


TTTGTGCCAT GATCAGCTAC 


TATTTCAGTA 


1800 




atttCctccag caacatctgt 


TGTTACCTCG 


TTTAATACTT TCATCGCTTC 


AACATATCCT 


1860 


40 


ATAATATCTC CCTTGTTAAC 


TTTGTCACCG 


ACATTCACAA TTGGTTCAGT 


TAATTCTTTA 


1920 


CTATCTTGTA AAAAGAATGT 


ACCTATCATT 


GGTGATTTAA TGTCATGATA 


ATCATTTGTC 


1980 




GAAACATCGG AGTTATCATT 


CGCTTTTGAA 


GCTGTCAAAT CATTATTGTT 


CATACTTTGA 


2040 


45 


TTTGATTGAT TACTGTGTGC 


AGCCAAATGA 


TTCGAGTCAG TGAAGTCAAT 


TTCTATTTCA 


2100 




TCTTCAAAAT TTTTATATTT 


AAATTTOTTA 


ACATCATTTT CCTTCACTAA 


TTTGATTATT 


2160 




TGTTCGATTT nTTCAATATT 


CATTTTACAA 


ATCCCCTTTT AAAATTGTTG 


CTAATTrm 


2220 


60 


CGAAGTATGT CGCAAGCTAG 


ATGTATCAAA 


AATTGGAGTC TTTTGATGAC 


TCTTAAGAAT 


2280 




TTCATTAAAC AGAGACATTT 


GTTCCCGATT 


CTTATCTACA GCTTCTTGGA ATGATATCCA 


2340 
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TACAGTTGCA ATTTTGGTAT AACCACCTAT CGTTTGTTTA TCATTAAQCA OAATAATAGG 24 60 

TTGACCATCA TTTGOTACCT GAACACTACC AAGAGCAACC GGTTCAGAAA TGATATCTGC 2520 

TTGATTAACT GGTGCAACGC TGTCACCTTC CAAACGATAG CCCATACGGT CTGATTGTTC 258 0 

AGTAATTAAA TATGGATGAT TTACAATTTT CGCTCTAGCC TCTTCAGAAA ATGCCTCGAA 2640 

TTGAGGTCCT TGAAGAATGT GTATAATATT ATTTTCTGGC AATAAATCGT CCTGTAAATG 2700 

AATCGTCTTT CCAATGTTTT CTTTAAAGTC ATTATTTATT TTCACTGTTA TTACATCATC 2760 

AGCTAATAAC TTTCTACCTT TGAAT 2785 
(2) INFORMATION FOR SEQ ID NO: 134: 

U) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1010 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 134: 

AATGGAAACG GTTGAAACAG CAATTATTAC TATTTCTATG GGTGAAGGTA TTTCAGAGAT 60 

ATTTAAATCA ATGGGTGCCA CACATATCAT TAGTGGTGGA CAAACGATGA ATCCTTCTAC 12 0 

AGAAGATATC GTTAAAGTCA TTGAACAATC AAAATGTAAA CGTG CAATTA TTTTACCGAA 180 

TAATAAAAAT ATCTTAATGG CAAGTGAACA AGCAGCGAGT ATTGTTGATG CAGAAGCTGT 24 0 

TGTTATTCCA ACGAAATCTA TTCCTCAAGG TATAAG CGCA CTATTCCAAT ATGATGTGGA 3 00 

CGCAACACTT GAAGaAAATA AAGCGCAAAT GGCTGATTCA GTAAATAACG TTAAATCTGG 3 60 

TTCATTAACG TACGCTGTTC GTGATACGAA AATTGATGGC GTTGAGATTA AAAAAGACGC 4 20 

GTTTATGGGC TTGATTGAAG ATAAGATTGT AAGCAGCCAA AGTGATCAAT TAACAACGGT 4 80 

TACTGAGTTG TTAAATGAGA TGTTAGCAGA AGATAGTGAA ATATTGACTG TGATTATTGG 540 

TCAAGATGCA GAG CAAGCAG TTACAGATAA CATGATAAAC TGGATCGAAG AGCAATATCC 600 

AGATGTAGAA GTGGAAGTTC ATGAAGGTGG ACAACCAATT TATCAATATT TCTTTTCAGT 660 

AGAATAAAAA TTTAAAATAA AAAACTACCA ATGATAAATC ATCAGTTGGT AGTTTTTTAT 720 

TTTGCTATTT TAGTGATATT GCGGGTTAAA AGTATCGTTC TCGAGTTGCT AACAATGTCA 78 0 

TGTTCAACTT AGTCATGATA AAATAAATAA CATACTAAAT GATACGTAAA ATCAAATAAA 84 0 

50 ACATAGGTGA TTTATTTTGG CTAAAGTAAA CTTAATAGAA AGTC CATATT CTCTTTTACA 900 

ATTAAAAGGT ATAGGTCCTA AGAAAATAGA AGTATTGCAA CAACTAAATA TTCATACAGT 96 0 
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(2) INFORMATION FOR SEQ ID NO: 135: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1540 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



10 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 135: 





TGTAGTTGAA CATQAACAAC AAAAGAAAGA AAAGACAAAA AAGCAATACA AGCCATTTTG 


60 


IS 


GATTGTCATG 


AGTTTTATAA 


TACTTATAGT 


TGTACTATTA 


CTCCCGGCAC 


CTTCAAGTCT 


120 




GCCGATAATG 


GCTAAGGCAG 


TACTAGCTAT 


TTwAGCTTTT 


GCAGTTATTA 


TGTGGGTAAC 


180 




GGAAGCTGTA 


TCATATCCGG 


TGTCAGCAAC 


TTTAATTATT 


GGCTTAATGA 


TATTACTTTT 


240 


20 


AGGATTTAGC 

•WJVM* AAA IWJVr 


CCTGTTCAAA 


ATTTAGGGGA 


GAAGCTAGGT 


AATCCGAAAA 


GTGGCAGTGC 


300 




TATTTTAflPT 


GGAAGTGACC 


TTCTAGGAAC 


TAATCATGCA 


TTATCATTAG 


OGTTTAGTGG 


360 




ATTTGCAACT 


TCAGCTGTAG 


CTCTCGTTGC 


AGCTGCATTA 


TTTTTGGCTG 


CTGCTATGCA 


420 


25 


AGAAACGAAT 


TTGCATAAAA 


GACTAGCTCT 


TTTAGTGTTA 


TCAATTGTTG 


GTAATAAAAC 


480 




TAGAAATATA 


GTTATTGGAG 


CAATTATCGT 


TTCAATTGTA 


CTTGCATTTT 


TCGTTCCTTC 


540 




TGCAACAGCT 


AGAGCAGGGG 


CAGTTGTACC 


AATCTTGCTG 


GGTATGATTG 


CGGCATTTAA 


600 


30 


AGTTTCCAAA 


GATAGCAAGT 


TAGCGTCTTT ATTAATAATT ACTTCAGTAC AAGCTGTGTC 


660 




AATTTGGAAT 


ATTGGTATCA 


AAACGGCGGC 


AGCACAAAAT 


ATCGTAGCGA 


TTAATTTTAT 


720 




AAACCATCAA 


TTAGGATTTG ATGTTTCATG 


GGGCGAGTGG 


TTCTTATATG 


CAGCGCCTTG 


780 


35 


GTCCATAGTT 


ATGTCCGTAG 


CTTTATATTT 


CATCATGATT 


AAAGTGATGC CTCCAGAAAT 


840 




TAAT&CAATA 


GAAGGTGGTA 


AAGATTTAAT 


AAAAGAAGAA 


TTGCATAAAC 


TTGGCCCCGT 


900 


40 


TAGCCCACGT 


GAATGGCGTT 


TAATTGTTAT 


AT CGATGTTA 


TTATTACTGT 


TTTGGTCAAC 


960 


TGAAAAAGTA 


TTACATCCGA 


TTGACTCTGC 


AT CCATTACT 


ATTATTGCTT 


TAGGTGTTAT 


1020 




GTTAATGCCG 


AAAATTGGTG 


TCATGACATG 


GAAACATGTT 


GAAAATAAAA 


TACCATGGGG 


1080 


45 


AACAATTATC 


GTGTTTGGTG 


TAGGTATTTC 


ACTAGGTAAC 


GTTCTTTTGA 


AAACAGGTGC 


1140 




AGCTCAATGG 


TTAAGTGATC 


AAACTTTTGG 


TGTTTTAGGT 


TTAAAACATT 


TACCTATTAT 


1200 




CGCGACAATT 


GCACTTATCA 


CGCTTTTTAA 


TATATTGATT 


CATTTGGGCT 


TTGCGAGTGC 


1260 


50 


AACAAGTTTA 


TCATCAGCGT 


TAATACCTGT 


TTTTATTTCG 


CTAACCTCTA 


CGTTACACTT 


1320 




AGGAGACCAG 


TCTATAGGAT 


TTGTTTTAAT 


TCAACAATTT 


GTTATTAGTT 


TTGGTTTCTT 


1380 
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AGATTTCTTG AAGGCAGGTA TACCATTGAC AATTGTAGGG aATAtCtAgT GaTAGTTTTT 1500 
AGCATGACTT ATTGGAAATG GGTAAGGTTO CnTTAATTAA 1540 
5 (2) INFORMATION FOR SEQ ID NO: 136: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11823 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(Xi> SEQUENCE DESCRIPTION: SEQ ID NO: 136: 

IS 

ACTTCTCACA ATAAGAAATA TGAAATTGTT ATGTGTTAGT TGAGATTCAG TGATGAATTA 60 

CTTTTATCAT TTAAAATGTT GTTATCATTG TCATGCGTTA CCAAATCGCT TACGTATACA 120 

CGATTCCCAA TCTTAACATA GACGATTTGT ATATCAGAAT TTTCTGATTA CTAACAGTTT 180 

20 

ACCTAAGTTT AAATATCTGT TCAATGATTT TCAGTTATTT TTAAAAGAAA AATCGTAATG 24 0 

CTGCCATGAT AACAATCCCA CTAATAATTG TAATAGTTAA AtACGCGTGA TTATAGATAA 3 00 

2s AATAACCGTC GGAATGAGCG CGATAATGTA AGGGATGTTT AATGTATACC CCTCACCATG 360 

AGGCGTCTGT TGAATAATGC TGTCAATGAC AAGTGCCGTA AATAGTGTGA TTGGGATAAA 420 

TGATAGCCAT CGAACCACGA CATCAGGCAA TTGCACTTTT GAAATCATGA TAAAAGGTAT 4 80 

30 AATTCGAATT AATAGCGTTA CGATACCACA CAATAAAATA AGT ATT AACA TGTTCATATG 54 0 

AGTTATCATT GTTCCATCAT CACTCCTAAC GCTGCTGAAA TTGTGGCTGC AATTAATATT 600 

GCTAGATATG AAG G CAT AAA CAT A CTTAG C GATAACATCA TTACTATGAC GGCAATAATG 6 60 

35 AG T ACT ATGT AAATTCTTAA TCGCGATTTA GTAATTGATT CAAATTGCGC AATGGCCAAA 720 

AAGATAAACA TAGCCGTGAT AGCAAAATCT AACCCTAGCG TTTGCGGATT TGAGATATAT 780 

TCGCCAAATA AAGCCCCAGC TACACATGAA ATTGCCCAAA ATAAATATGC TGTGATGTTA 84 0 

40 

AGACCATGCA TCCAACGATC ATTGATAGCT TCTCCTTTTA AATAAGGTGT AATGGCGACG 900 

CCAAACGTTT CGTCAGTTAC TAATGAACCT AATCCAACAC GGTTCCAAAA CCCATATGTC 960 

TTGAAGTTTG GTGCAAGCGA CATACTTAAA AGGAACATTC TTGAATTTAC GATAAATACA 1020 

45 

GTTAGTACAA TCGCTGATAT AGGTGTACCT GCTATAAACA ACGCGCACAT AATAAATTGC 1080 

GCAgcaCCGG CATATATAAC AAGACATAAC AAGACAATTT CTAAAATACT AAAGTTTTGA 1140 

60 GACGAAGCCA CAATACCAAA TGAAATACCA ACACCGGCAT AACCCAATAA TGTTGGGATA 1200 

CACTCTTGCA CGCCTTGTCT AAAACTTAAA TGTGTTGTCA TCTCAATTAC CTCCTTTGCC 1260 

55 
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TAAGCAATAA CATTAGACAT 


' CAOTTTGTCT 


■ GAGGTTAGAC 


ATTCOGGAGT CTTTAGTCAG 


13 80 




CTTCATATTA ACT1TTTATT 


TTTGAGAATT 


TTCAATTTTT 


TATTTAAGAC TACCTCCATA 


1440 


6 


TTTTCTATGG 


aTTTGTAGTT 


GTTTTTAAGT 


ATCAATTTTA 


TAAATTTTTA TATCTGATGA 


1500 




TGAGTCTGGG 


aTATTGaTTC 


ATGTACCACT 


CCCTTaTaAT 


CATCCCCTCC CCCTaCCCTA 


1560 




CTCCATCGAT ATAACTCATA 


CTACATATCA ACGAAATCAG 


TATTTTATCG CTTCCTTTCC 


1620 


10 


TATATTAGTG ATGCTCAAAC 


TTGTTACGTT 


TTAGATTGTT 


TTAGTTCATC ATAATTATCC 


1680 




CGTATTGTTG 


CTATAATGAA 


ATGCGTTCAC 


CCCATTAAAC 


CACAAACTTA ATTTATTGTT 


1740 


15 


GTTATGTGCA 


TTGGCTCACT 


ATTATATTTT 


TACAGCACAA AAAAAGTGGC GACAGTTCGT 


i ann 


CACCACTTTT 


TAAAATATTA 


TTTAAAGTAT 


CTTGCCCTTG 


CTTTAAGTAT ACGTAGATAT 


loou 




ATACTTTTTA 


AAGCTTGTAG 


CTAAAGCCTT 


TATTTAACTG 


GTTTTGAAAT TTGTGTTTTA 




20 


CCACCCATAA 


ATGGTACTAA 


TGCTTCTGGA 


ATTGTTACTG 


TTCCATCTTC ATTTTGGTAA 


1 a d n 




TTTTCAACAA 


TAGCAGCAAA TGTACGTCCA ACTGCTAAAC 


CACTACCATT TAATGTATGT 


<i r\ a t\ 
2040 




GCTAATTCTG 


GTTTAGCTGC 


TTTGTCACGC 


TTGAAGCGGA 


TGTTAGCACG AOGCGCTTGG 


2100 


25 


AAATCCGTAC AGTTTGAGCA TGAACTAATT 


TCTTTATAAT 


CATTGTAGCT TGGTAACCAA 


2160 




ACTTCTAAAT 


CATATGTTTT 


GCTTGCACTA 


AATCCAATAT 


CACCTGTACA TAAAATAACA 


2220 




CGACGGTATG 


GTAAACCTAA 


CTCTTCTAGA 


ATTGCTTCTG 


CGTTTGTTGT CATTTCTTCT 


2280 


30 


AAAGCATTCC 


ATGAATCTTC 


AGGTTGTTCA AAACGTACCA TTTCCACTTT ATCGAATTGA 


2 34 0 




TGTAAACGAA 


TTAATCCTCT 


TGTATCTCTA 


CCTGCTGATC 


CTGCTTCACT ACGGAAACAT 


24 00 




GCAGATTGAC 


CAGTGAATTT 


TTCAGGAAGT 


ACACCTGGTT. 


GAATAATTTC ATTACGGTAG 




35 


AAATTCGTTA 


ATGGTACTTC 


AGCAGTTGGA 


ATTGTATATA- 


ATCCTTCTTT TTCTACTTTA 


0 con 




AAT7£VATCTT 


CTTCAAATTT 


AGGTAATTGA 


CCTGTACCAT 


ACATTGTATC TGCGTTCACA 


2580 


40 


AGCTGTGGTA 


CCATCATTTC 


TGTATAACCA 


TGTTGTGTTG 


TATGTTTTGT AATCATATAG 


2640 


XTCATTAAAG 


CACGCTCTAA 


TTGCGCACCT 


TCATTTGTTA AATATACAAA ACGOGCACCT 


2700 




GAAACTTTTG 


CTG CACGATC 


AAAATCAGCC 


ATTTTCAATT 


CTTCTACAAT ATCCCAATGT 


2760 


45 


GCTTTGGGTT 


CAAATGAAAA 


CTCaCGTGGT 


GTACCCCACT 


TTTTAACTTC AACGTTATCT 


2820 




TCATCAGATT 


CACCTTGAGG 


TACATCATCA 


CTTATTAAAT 


TTGGAATAOG ACAAAGGATA 


2880 




CCTGTCATTT 


TATTATCAAT 


TTCATTTAAT 


TGACTATCTT 


TTTCTTTAAT ATCGTCACCT 


2940 


50 


AATGTGCGCA 


TTTCAGCAAT 


CACATCATCA 


GCATTTTCTT 


TATTACGTTT TTTTAATGCG 


3000 




ATTTCTTCGC 


TTACTTTATT 


ACGACGTGCT 


TTCATTTCTT 


CTGTTGCACT AATTAATTTA 


3060 
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TCAATTTTCC 


TCTTAACTGT 


GTCAGGCTCA TTTCTGAATA 


ATCTAATGTC 


TAACATTAAC 


3160 




CTTCATCCTT 


TCCCAAATAA 


TTATf^ATTTA 


X i AlUMflnlVJ 


ACGTACGTCT 


TTATTTTTTA 


3240 


5 


GAAAATAAAA 


AAAGACCACA 


TCCCTACAAG 




TACGCGTTGC 


CACCCTATTT 


3300 




AACAATTTAA 


GTTATAAAGA 


X MUnL X n/V"lV_. 




CTTCACTAAA 


ATAAOGGTTA 


3360 


10 


TCACCGATTG 


TTCTTTTAAA 


X 1 1 ± 




ATATGTTGAT 


TCTTGTTCAC 


3420 


ACTAACCACA 


AGCTCTCTGA 


x A 1 UaAAUiu 


1 A 1 A I A1TAL 


TTGTCCTACG 


AACAATGTCT 


3480 




TATTAAGTTA 


TTTTTAATAT 


AGCAAACTAT 


ATTTGCTTTT 


TCAAGTAACG 


ATTTCAAACA 


3540 


15 


TCACTCATGT 


CGATTTAGTG 


ACATG CAGTC 


GTTTGATAAA 


TTGATTGCTT 


TAAATACTGT 


3600 




GCAACCGCTT 


CAATATCTTT 


ATGAAATTGA 


CGATCATGTG 


TAATGGATGG 


CACGATACTT 


3660 




CGAAACTCAT 


CATACTTGCG 


ACGTGTTTTT 


GGTGATAATC 


CTTCAACACC 


TTTTAACTCT 


3720 


20 


GCTGCTTGTA 


ATGCAATAAC 


ACATTCGATT 


GCCAGCACAC 


GTCTTGCATT 


TTCAATAATT 


3780 




TGATAACCAT 


GTCTAGCAGC 


TGTAGTT CCC 


ATAGATACGT 


GATCTTCTTG 


GTTCGCAGAT 


3840 




GAAGTGATAG 


AATCAACACT 


CGCTGGATGC 


GCTAAAGTTT 


TATTTTCAGA 


AACGAGACTT 


3900 


25 


GCAGCAGCAT 


ATTGCATAAT 


CATCGCGCCA 


CTTTGCAATC 


CTGGCTCTGG 


ACTAAGAAAT 


3960 




GCTGGTAAAT 


CACCATTTAA 


TTGAGGATTT 


ACTAGTCGCT 


CTAGACGACG 


TTCCGATACG 


4020 




TTTGCTAATT 


CACTTACACC 


TAATTTAAGA 


TGATCTAATG 


CAAAAGCAAT 


AGGTTGTCCA 


4080 


30 


TGGAAGTTAC 


CACCTGAAAT 


AACAAACGTT 


TCATTTGCTT 


C CT CAAAT AT 


AAGTGGATTA 


4140 




TCATTAGCCG 


CATTCATTTC 


AAATTCTAAT 


TGCTGTTTAA 


CATAATTGAA 


TACTTGAAAA 


4200 




CTCGCGCCAT 


GGATTTGTGG 


TATACAACGC 


AACGTATATG 


CATCTTGTAC 


ACG TATTTCT 


4260 


33 


GATTGTCGCG 


TCGTTAATGT 


TGATCCTTCT 


AAC CAATCAC 


GCATACGCGC 


TGCCACATTA 


4320 




ATCT6TTCTT 


GAAAATTACG 


AACTGCGTGC 


ACAT CATGTC 


GATATGCATC 


TATAATGCCA 


4380 


40 


TTAAGAGACT 


GATGCGTTAA 


IX3CAGCAATC 


CATT CAG ATT 


GGTAACCTAA 


AT CTTCTG CT 


4440 


TCTATATAAC 


TAATGACACC 


TTGAG CTGTC 


ATAG CTTGCG 


TACCATTAAT 


CAATGCTAAA 


4500 




CCTTCTTTAG 


CCTGAAGGTT 


CAAAGGTTGT 


CTATTTAATT 


CTCTTAATAC 


ATCGTCACTA 


4560 


45 


TCCTTTTCTT 


CCCCTCTGTA 


CAATACTTTC 


CCTTCACCAA 


TTAATGCTAA 


TGCTAAATGT 


4620 




GATAATGGCG 


CTAAATCTCC 


TGATGCACCG 


AGAGAGCCTT 


GCTGTGGGAT 


TATCGGTATA 


4680 




ATACGTTCAT 


TTATAAAAAA 


TTGTAATTGT 


CTCACTAATT 


CTAAAGTGGC 


ACCTGAATGA 


4740 


50 


CCTTTTAATA 


ATGTATTCAA 


TCGTAAAATC 


ATCATGACTA 


ATGCTACTTC 


TTTTGAAAAT 


4800 




GGCTCACCTA 


GTCCACAGGC 


ATGTGAGCGT 


ATCAGATTCA 


CTTGTAATTC 


ATTATATTGC 


4860 
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TCCTCATTTT CAATAATACG TTCAACTACC GCTCTACTTT TTTTGACACG TTCTAACOCA 4980 

TCATCAATAA TTTCAATCTT TGATTGTTCT TGTAAAAATG ATTTAATATC CTCAATTOTT 504 0 

AGTGTTTCAC CATCTAAATA TAAAQTCATA TATGTTACCC CCTTGTTTAT ATTAAGTAAC 5100 

CCATCCTTCT TGAAGTATAC GTTTTCATTT TTATTGAAAC AATGGTTTTA CGTACATTTA 5160 

TAACCTATTA TCAGAGCACT ATTGTAGTGC GTTAAAGOAT ATTAAGATTG TTC3TAAGCAT 5220 

ATTTAATAAT TTATCTATTG ACGAATTGCA TATACAGGTA TAGTATTTTC TATTGTATTT 5280 

AACGACAAAT AATAATGAAT TCAGAAATTT ATAATACATT TTGTTAAAAG TTACTATATA 5340 

TTTTTAAAAT TGAATAAATT CGGAAAAGGC TTTTACATGG GAGGTTATAT CACTATGGAA 5400 

ACGTTAAATT CTATTAACAT TCCTAAGCGT AAAGAAGATT CACATAAAGG TGATTATGGC 5460 

AAAATTTTAT TAATTGGTGG ATCTGCTAAC TTAGGTGGTG CCATTATGTT AGCGGCTCGT 5520 

GCATGTGTAT TTAGCGGTAG TGGTTTAATC ACTGTAGCTA CACATCCAAC AAATCATTCA 5580 

GCATTACATT CTCGTTGCCC AGAAGCGATG GTTATTGATA TTAATGATAC GAAAATGTTG 5640 

ACGAAAATGA TTGAAATGAC TGACAGTATA CTAATTGGTC CAGGTCTTGO CGTTGATTTC 5700 

AAAGGAAATA ATGCCATTAC ATTCCTACTA CAAAATATAC AACCGGATCA AAATTTAATC 5760 

GTAGACGGCG ATGCGATTAC AATCTTTAGT AAACTGAAAC CGGAATTACC TACATGTCGT 5820 

GTGATCTTTA CACCACACCT CAAAGAATGG GAACGATTAA GTGGTATTCC TATTGAGGAA 5880 

CAGACATATG AGCGTAATCG TGAAGCAGTT G AT CGTTTAG GTGCAACTGT TGTACTTAAA 5940 

AAACATGGTA CTGAAATTTT CTTTAAAGAT GAAGACTTTA AATTGACAAT CGGTAGCCCA 6000 

GCAATGGCGA CTGGTGGTAT GGGCGATACA CTTGCTGGTA . TGATTACAAG - CTTTGTCGGT 6060 

CAATTTGATA ACTTAAAAGA AGCGGTTATG AGTGCCACAT ATACACATAG TTTTATTGGC 6120 

GAAA&CCTTG CAAAAGATAT GTATGTGGTG CCACCATCAA GACTTATCAA TGAAATACCT 6180 

TACGCAATGA AACAATTAGA AAGTTAGTCA TTACTAATCA TTGAATATAG TAAAGCATTA 6240 

CTTTCTAGCA TAAAAATAAG ACTCCCCTAC ATATAGGGAA GTCTTATTTT TTATTATTCT 6300 

TCATCTGATG ATTGTTGTAT ATCTTCTTCA ACACGATCCA TGAAATCTTG TCTTACTTCA 6360 

ATACGTCCAT CTTCATCATT TTCTTCTGAA TCAATCACTT CAGTATGAAT TGCATTTCCT 6420 

GGTGTTTCAT CATTTa CAAC CGCTTCACGT TGTTGTTCAG TACCATCTTC AGATACAGTT 64 80 

GAAGTAGATT GCTCATCTTC ATTCGTTTCA TCTTCTGCAT CTTCTTTTAC TTTAGCAACC 6540 

GTTGAAACAA ATTGATCATC ACCTAAGCGA ATTAAGCGAA CACCTTGTGC TGCACGACCA 6600 

TTTTGAGAAA TATCTGCAAC ATCTAGTCGA ATAATGACAC CTGCATTAGT AACAATCATT 6660 
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GTAGCTGTTT TAATACCTTT ACCACCACOA TTTGATAAOC GATAGTCATT AACTGGCGTA 6780 

CGTTTACCAT AACCATTTTC AGTAACTACT AATACTT CAT CAACACTGTT TGCATGAGCT 6840 

ACATCAAGCC CTACAACTTC GTCACCTTCA CGAAGTGTAA TACCTTTCAC ACCCGTTGCT 6900 

GTACGGCCTA AAGGACGTAA TGTTGATTCA GGGAATCGAA TTAATGATGC ATGTGATGTA 6960 

CCAATCAAGA TATCTTCTTG ACCACTTGTT AAGCGAACTG CAATTAACTC ATCATCTTCT 7020 

CTGAACGAAA TCGCAATCTT ACCATTTCTA TTTATTCTTG AGAAGTTACT TAATGCTGAA 7080 

CGTTTAACGA CACCACGTTT AGTTGCAAAC ACTAAGAAGT TGTCTTCACT TTCAAGGTCT 7140 

TTAACAGCAA TCATTGTACT AATGACTTCA TCATTTTCAA GTTCAATAGC ATTCACTACA 7200 

GGAATACCTT TAGACTGTCT TGATAACTCA GGCACTTCGT AACCTTTAAG TTTGTATACA 7260 

CGACCTTTGT TAGTAAAGAA CAATACATGG TCATGTGTAC TTAAAGTTAC CAATTGACTG 7320 

ACAAAATCTT CTTCCAATGT ATTCATACCT TGAACACCAC GACCACCAOG GTTTTGAGCA 7380 

CGATATGTAG ATACCGGCAA ACGTTTAATG TAGTTATTAT GGCTTAGTGT AATTACTATT 7440 

TGTTCTTCTG GAATTAAGTC TTCGTCCTCT AAGTCTTCAA ATCCACCTAA TTGAATTTCT 7500 

GTACOACGAT CATCACCGAA ACGATCTCTA ATTTCAGTCA ATTCATCTCT AACTAACTGT 7560 

AATAACACTT CTTCATCAGC TAAGATTGCT TCTAATTCAC TAATATAATT TAATAACTCA 7620 

TTATATTCAG CTTCAATTTT GTCTCTCTCT AAACCTGTTA GACGTCTTAA ACG CATGTCT 7680 

AAAATAGCTT GAGCTTGTTT TTCAGAAAGT TTGAAGCGTT GTTGCAAGCT TTCCATTGCA 774 0 

ACTTTATCTG TATCTGACTC ACGAATCGTT GAAATAATTT CATCGATATG GTCAAGTGCG 7800 

ATACGTAATC CTTCTAAAAT GTGGGCACGA TCTTTAGCTT TACGTAAgTT GTATTGCGTA 7860 

CGTCTTCTAA CAACTGTCTT TTGATGCTCT AAATAATGTA CCAACGCTTC TTTTAAATTA 7920 

ATAAGCTTCG GTCTACCATT TACAAGTGCA ATCATATTCA CACCAAATGA TGTTTGAAGA 798 0 

GGTGTTTGTT TGTATAAGTT ATTTAAAATG ACACTAGCAT TTGCATCCTT ACGCACATCA 804 0 

ATAACGACAC GCACACCAGT ACGTAAACTT GTTTC^TCAC GTAAATCAGT GATACCGTCA 8100 

ATTTTCTTGT CACGAACGAG CTCTGCAATT TTTTCAATCA TACGAGCCTT ATTCACTTGG 8160 

AAAGGAATTT CAGTGACAAC AATACGTTGA CGTCCGCCTC CACGTTCTTC AATAACTGCA 8220 

CGAGAACGCA TTTGAATTGA ACCACGACCT GTTTCATATG CACGTCTAAT ACCACTCTTA 8280 

CCTAAAATAA GTCCAGCAGT TGGGAAATCA GGACCTTCAA TATCCTCCAT TAACTCAGCA 8340 

ATTGAAATAT CAGGGTTCTT ACTTAAGCTA AGTACACCAT TGATTAATTC TGTTAAGTTA 84 00 

TGTGGTGGAA TATTCGTTGC CATACCTACC GCGATACCTG ATGCACCATT GGCTAATAAG 84 60 
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AAATCTATTG TATCTTTATT AATATCACGT 
GCTTCAGTAT AACGCATTGC TGCTGOGCCA 
5 CCATCAACAA GCGGATAACG ATAACTGAAA 

ATAGATGAGT CACCATGAGG GTGATATTTA 
TTTTTATATG ATTTATCCGG TGTCATACCT 

10 

TGTACTGGTT TTAAACCGTC ACGAACATCT 
GCATAATCTA AAAATGATTC ACGCATTTCA 
TGAGGTAATT CAGCCATCAA GAGTTCCTCC 

1S 

TCTAAGTTTG CATAAACTGC ATTATCTTCT 
CCCATTAACA TTTCAAATGT TTGGTCCGCT 

. AGAGCGCGGT GCTCAGGGTT CATTGTTGTT 

20 

AGACCTTTGT ATCGTGCAAT AGACCATTTT 
TCAAGTTCCC TATCATTGTA TACATAATAC 

25 GGTGGCTGTG CAATATACAC ATAGCCTGCT 

AATGTTAATA ACAATGTTCT AATATGCGCT 
ATTTTGTGAT ATCTTGCTTT CGCTAGATCA 

30 GTGATCATTT GACGAATTTC ATTGTTATTC 

TTTAATATCT TACCTCGTAA TGGTAAAATC 
GTAGACCCCC CGGCAGAGTC CCCTTCGACT 

35 CTAGAGCAAT CGGCTAATTT ACCTGGAAGG 

GTTACTTCAC GCGCTTTTTT CGCAGCAACA 

ACCACTGTAC GTGCGACTTG TGGATTTTCA 

40 

AATTTATCTA CAACTTGACG CACTTCAGAA 

AATTGAGGAT CACCATGTTT GATAGATATA 

CCAGAAAGTC TATCTTTTTC TTCTTTCATA 

45 

ACACGCGTTA ATGCACGTTT GAATCCGTCT 
TTATTTGCGT AAGTTAAAAG ATTTGTGGCA 
ACTTCAATAT CATCTTTAGA TTGATGAATA 

50 

TTTTCGTTCA ATAACTCAAC GTACGATTTA 



AACAGTTCAA GTGTGATTTT AGTCATACGC 65B0 

TCTCCATCCA TTGAACCAAA GTTACCTTGG 8640 

TCTTGAGCCA TACGTACCAT TGCTTCATAA 8700 

CCCATTACGT CACCAACGAT ACGTGCTGAT 8760 

TGTTCATTTA ATCCATATAG TATACGACGA 8820 

GGCAATGCAC GAGCAACGAT AACACTCATC 8880 

CTGGTAATAT TTCGTTCATT TATTCTTGAT 8940 

TTCAAAAGTT CAGTTCACAG CGCTTAGAAG 9000 

ATAAATTGTC TACGGTTTTC TACAACGTCA 9060 

TCAATCGCAT CTTCAAGTTT TACTTGTAAA 9120 

TCCCAtAATT GATCTGCATT CATTTCTCCA 9180 

GGTGTTGGAT TCAATTCAGA TTTAAGTTTA 9240 

TTTTGTTTAC CTTGTGTCAG TTTATACAAC . 9300 

TCAATTAACG GTCTCATAAA TCGATAGAAG 9360 

CCATCCACAT CGGCATCAGT CATAATGACG 9420 

AAGTCG CCAC CGATTCCTGT ACCAAATGCT 9480 

AAAATTCTAT CTAATCGTGC TTTTTCAACA 9540 

GCCTGCGTTC TAGAGTCACG ACCAGATTTT 9600 

AAGAAAATCT CACATTCTTC AGGACTTTTA 9660 

CTTGCTACAT CTAACGCTGA TTTACGACGT 972 0 

CGTGCACGTG CCG CCATAAT ACCTTTTTCA 97 80 

TATAAAAATC GTTCAAAGTG CTCTGAGAAT 9840 

TTAC CTAATT TTGTCTTCGT TTGACCTTCG 9900 

ATTGCTGTCA TACCTTCACG TGTATCTTCA 9960 

ATCTTGCTAC TTAAACCATA ACTATTTAAG 10020 

TCATGOGTAC CACCTTCATA CGTATGAATG 10080 

TATCCTOAGT TATATTGAAT CGCAATTTCT 10140 

TAAATTGGCT CATCATGAAT AGGTTCTTTA 10200 

ATACCGCCCT CATAGTGATA GGAGTCTTCT 10260 
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GCAAGCTCTC TAATACGCTG CTGTAATGTT TCATAGTTGT ATACAGTTGT CTCTGTGAAG 103 00 

ATTTCTCCAT CTGCTTTAAA ACGAAtGaCA GTACCTGTCT TAtCAGTnGT GCCAACTTCT 10440 

TTTAAGTCAA ATTGAGGTAC ACCTTTTTTA TATGCTTGAT GATATATAGT CTCATTTCTG 10500 

TGTACATATA CTTCTAAGTC TTGTGACAAT GCGTTTACAA CTGATGAACC AACACCATGT 10560 

AAACCACCAG ATACTTTGTA TCCGCCACCG CCAAATTTAC CACCAGCATG TAAAACAGTT 10620 

AAAATAACTT CGACAGCTGG ACGTCCCATT TTTTCTTGAA TATCAACTGG GATACCACGT 10680 

CCGTTATCCG TTACTTTAAT CCAGTTATCT TTTTCAATAA CAACTTCAAT TTGATTTGCA .10740 

TAACCaGCTA ATGCTTCATC GATACTATTA TCGACAATTT CCCACACTAA ATGGTGCAAA 10800 

CCTCTCTCTG AAGTCGATCC TATATACATA CCTGGTCTTT TACGTACTGC TTCTAAACCT 10860 

TCTAATACTT GTATTTGCCC AG CACCATAA TTATCCGTGT TGTTTACATC TGACAATGCA 10320 

GTCACCATCG CTTTCTGTTA CTTTATAATT TCACCTTGAT TAATACGATA CAATTTAGCG 10980 

TTATTCATGA TTTCATGATC AATACCATCT ACAGATGTCG TAGTGACAAA TGTTTGTACT 11040 

TTATGCTGAA TCGTACTTAA TAAATGCGTT TGACGCGAAT CATCTAATTC ACTGAGTACA 11100 

TCGTCTAATA ATAAGATGGG ATATTCCCCA ACTTCGATAT TCATTAACTC AATTTCAGCT 11160 

AATTTAATGG ACAAAGCCGT TGTACGTTGC TGTCCTTGAG AAC CAT ATGT TTGAGCATCC 11220 

ATGCCATTCA CATCAAAACT TAT AT CATCT CGATGTGGTC CGAATAAGCT AATGCCTCGT 11280 

TCTTTTTCTC TTTGCATATT ATCG CTAAGA ATAGACATAA TTTCTTCAAG TCGTGCCGCT 1134 0 

TCATTTTGAG CATAATCAAA TTTAAGACTA GGTAAATAAT TCAG CGACAA CGCTTCTTTA 11400 

TCATTTGTGA TACCAGCATG AATCGGTTTA GCTAACGACT CTAGCTCTTG AATAAAATGT 114 60 

GCACGTTTAT CAGTTACTTT CATTG CATAT TCAGCAAACT GCTGATTTAA TACTTCCAAC 11520 

ATTGTTAAGT CCTTTTTTTG GCCTAATTGT AACTGCTTTA AGTAATTATT CTTTTGCTTT 11560 

AAAATACGTT GGTATTGAGC TAAATCATTT AAGTAAACAG CAGAAATTTG GCCCAACTCC 1164 0 

ATATCTATAA AGCGTCGTCT TATTtGrGGr GAGCCTTTTA CAATATTCAA ATCTTCTGGC 11700 

GCAAATAGAA CCACATTGAG GTGTCCAATA TATTGAGTTA GACGACTTTG CTCTAAGTGn 11760 

ATTCACTTTG GACTTGTTTA CCTTTnTTAG TTATAAACAT TGTTAATGGG CATCGTGCCG 11820 

TGT 11823 
(2) INFORMATION FOR SEQ ID NO: 137: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 692 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 



$5 



728 



EP0 786 519 A2 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 137: 



S 



15 



ATAATTATTA 


ACATGGTGTG 


TTTAGAAGTT 


ATCCACGGCT 


GTTATTTTTG 


TGTATAACTT 


60 


AAAAATTTAA 


GAAAGATGGA 


GTAAATTTAT 


GTCGGAAAAA 


GAAATTTGGG 


AAAAAGTGCT 


120 


TGAAATTGCT 


CAAGAAAAAT 


TATCAGCTGT 


AAGTTACTCA ACTTTCCTAA AAGATACTGA 


180 


GCTTTACACG 


ATTAAAGATG 


GTGAAGCTAT 


CGTATTATCG 


AGTATTCCTT 


TTAATGCAAA 


240 


TTGGTTAAAT 


CAACAATATG 


CTGAAATTAT 


CCAAGCAATC 


TTATTTGATG 


TTGTAGGCTA 


300 


TGAAGTTAAA 


CCTCACTTTA 


TTACTACTGA 


AGAATTAGCA 


AATTATAGTA 


ATAATGAAAC 


360 


TGCTACTCCA 


AAAGAAACAA 


CAAAACCTTC 


TACTGAAACA ACTGAGGATA ATCATGTGCT 


420 


TGGTAGAGAG 


CAATTCAATG 


CCCATAACAC 


ATTTGACACT 


TTTGTAATCG 


GACCCGGTAA 


480 


COGCTTTCCA 


CATGCAGCGA 


GTTTAGCTGT 


GGCCGAAGCA 


CCAGCCAAAG 


CGTACAATCC 


540 


mTTATTTATC 


TATGGAGGTG 


TTGGtTTAGG 


aAAAACCCAT 


TTAATGCATG 


CCATTGGTCA 


600 


TCATCTTTTA 


GATAATAATC 


CAGATGCCAA 


AGTGATTTAC 


ACATCAAGTG 


AAAAATTCAC 


660 


AAATGAATTT 


ATTAAATCAA 


TTCGTGATAA 


nA 






692 



(2) INFORMATION FOR SEQ ID NO: 138: 

(1) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7900 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOIiOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 138: 

ATACTGTAGC GCAAATTTCA CAATGGCATG TTATAGAAGA TTTAGTTACG AATGAATTAG 60 

GTA*fTAGTAT TTTACCAACA TCAATTTCAG AgCAACTAAA TGGAGATGTG AAGCTGtACG 120 

CATTGAAGAT GCTCATGTAC ATTGGGAATT AGGTGTTGTT TGGAAGAAGG ATAAACAATT 180 

AAGTCATGCC ACAACGAAAT GGATAGAATT TTTGAAAGAC OGTTTAGGCT AACATATTAA 240 

TAAAGCACTC ATTATTTAAG GCGCATCATT ACGTGGGTCA TTGAAATAAT GAGTGTTTTT 300 

TTGTGAAAAT GAAGTGAAAT TTAGAGAGCG TTTCCATAGA AAATAGTAAT ACAAACTATA 360 

AAAAAAGAGT ATTTTTATAT TGTGTACGCC ATCTTTATAA TAGTTATTGT AACAATTTAG 4 20 

ACATATTTAG AAAGGGATGG CGCCATGCAC AAAGTCCAAT TAATAATCAA ACTACTACTA 4 80 

CAACTAGGAA TCATCATTGT GATTACTTAT ATTGGCACAG AAATTCAAAA GATTTTTCAT 540 
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ATTGTACCGC 


TAACTTGGGT 


AGAAGACGGT 


GCAAACTTTT 


TATTAAAGAC 


GATGGTCTTT 


660 




TTCTTCATAC 


CGTCAGTTGT AGGtATTATG GaTGtgCTTC CGAAATTACG CTAAATTATA 


720 


5 


TACTCTTTTT 


CGCAGTCATT 


ATCATAGGAA 


CATGTATCGT 


TGCATTATCT 




780 




TTGCTGAAAA AATGTCyGtT AAACwTAAAC ATCGTAAAGG TGTAGACGCt 


lnl urtrt 1 \JJ\ 1 


840 




TACUTGCAAG 


CCTTATTAAT 


GATTTTGTTG 


ACTGTOGTTT 


TATATTATTT 


WGC1AAAAGG 


900 


10 


MM% ^-ft % ^ift ft ft 

TTAGAAGAAA 


ft m M%m fttMAA ft ft 

AATATCCGAA 


CCCATTTTTG 


AATCCAGCAT 


TAATTGCATC 


TTTAGGAATT 


960 




ATTTTTGTCT 


TACTTATCTT 


TGGAATTAGT 


TATAACGGGT 


ATATGAAAGG 


TGGCAGTTGG 


1020 


15 


ATCAACCATA 


TTTTAAACGC 


AACGGTCGTA 


TGTTTAGCGT 


ACCCACTTTA 


TAAAAATAGA 


1080 


GAGAAAATTA 


AAGACAATGT 


CTCTATCATT 


TTTGCAAGTG 


TATTAACTGG 


CGTCATGCTG 


1140 




AATTTCATGT 


TAGTGTTCTT 


AACACTTAAA 


GCATTTGGCT 


ATTCTAAAOA 


CGT CATTGTA 


1200 


20 


ACGTTATTGC 


CCCGATCTAT 


AACAGCCGCA 


GTAGGTATCG 


AAGTGT CACA 


TGAACTAGGT 


1260 


GGTACAGATA 


CGATGACCGT 


ACTTTTTATT 


ATCACAACGG 


GTTTAATCGG 


TAGTATTTTA 


1320 




GGTTCGATGT 


TATTAAGATT 


TGGAAGATTT 


GAATCTTCTA 


TCGCCAAAGG 


ATTAACGTAT 


1380 


25 


GGGAATGCGT 


CACATGCATT 


TGGCACAGCT 


AAAGCACTAG 


AAATGGATAT 


TGAATCCGGT 


1440 




GCATTT AG TT 


CAATTGGGAT 


GATTTTAACT 


GCAGTTATTA 


GTTCAGTGTT 


AATACCTGTT 


1500 




CTAATTTTAT 


TATTCTATTA 


ATTTAGATAT 


TTAAAATGAT 


AGACAGAAAG 


GGAGGCTATT 


1560 


30 


AGTAATAATG 


GCAAAAATAA 


AAGCAAATGA 


AGCATTAGTT 


AAAGCATTAC 


AAGCaTGGGA 


1620 




TATAGATCAC 


TTGTATGGTA 


TTC CAGGAG A 


CTCAATCGAC 


GCATAGTCGA 


TAgTTTACGT 


1680 




ACAGTGAGAG 


ATCAATTTAA 


ATTTTATCAT 


GTACGTCATG 


AAGAAGTAGC 


AAGCTTAGCG 


1740 


35 


GCTGCTGGTT 


ACACAAAATT 


AACTGGTAAA 


ATCGGTGTGG 


CATTAAGTAT 


CGGTGGCCCT 


1800 




GGTTTAATTC 


ATTTATTAAA 


TGGTATGTAT 


GATGCCAAAA 


TGGATAATGT 


ACCGCAATTA 


1860 




ATATTATCTG 


GACAAACGAA 


TAGTACAGCA 


CTTGGAACGA 


AAGCATTCCA 


AGAAACAAAT 


1920 


40 


TTACAAAAAT 


TATGTGAAGA 


TGTAG CCGTT 


TATAATCACC 


AAATTGAAAA 


AGGTGACAAT 


1980 




GTGTTTGAAA 


TCGTTAACGA 


AGCAATTCGT 


ACGGCATATG 


AACAAAAAGG 


TGTAGCTGTT 


2040 




GTTATTTGTC 


CTAACGACTT 


ATTAACTGAA 


AAAATTAAAG 


ATACAACGAA 


TAAACCAGTA 


2100 


45 


GATACATCAA 


GACCAACAGT 


AGTAT CACCA 


AAATATAAAG 


ACATCAAAAA 


AGCGGTTAAA 


2160 




CTAATTAATA 


AAAGTAAAAA 


GCCTGTCATG 


TTAATTGGTG 


TAGGTGCGAA 


ACATGCGAAA 


2220 




GATGAGCTAC 


GTGAATTTAT 


TGAAATGGCT 


AAAATTCCTG 


TCATTCATTC 


ATTACCAGCT 


2280 


SO 


AAAACAATCT 


TGCCGGATGA 


TCATCCATAT 


AGTATCGGtA 


ACTTAGGTAA 


AATCGGTACC 


2340 
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CCATATGTGO ATTACTTACC TAAGAAAAAT ATTAAAGCCA TTCAAATTGA 


CACAAATCCT 


2460 




AAAAATATCQ GACATCOTTT CAATATTAAT GTAGGAATTC TTGGAGATAG 


TAAAATTGCG 


2520 


5 


TTGCATCAGT TAACTGAAAA TATTAAACAT GTTGCTGAAA GACCATTCTT 


AAACAAAACG 


25B0 




TTAGAACGTA AAGCGGTTTG GGATAAATGG ATGGAACAAG ATAAAAATAA 


TAATAGTAAA 


2640 




CCATTACGTC CAGAACGATT AATGGCATCA ATCAATAAAT TTATTAAAGA TGATGCAGTG 


2700 


10 


ATTTCAGCAG ATGTAGGTAC AGCAACAGTT TGGTCAACTC GATACTTAAA 


CCTTGGTGTA 


2760 




AATAACAAGT TCATCATTTC AAGTTGGTTA GGTACAATGG GTTGCGGTCT 


TCCAGGTGCA 


2820 




ATTGCATCAA AAATTGCATA TCCAAATAGA CAAGCCATCG CAATTGCTGG 


TGACGGTGCA 


2880 


15 


TTCCAAATGG TAATGCAAGA CTTCGCTACA GCAGTACAAT ATGATTTACC 


TTTAACTGTA 


2940 




TTTGTACTTA ATAACAAACA GTTAGCATTT ATTAAATATG AACAACAAGC AGCTGGTGAA 


3000 


20 


TTAGAATATG CAGTTGATTT TTCTGATATG GATCATGCAA AATTTGCTGA 


GGCAGCAGGT 


3060 


GGTAAAGGTT ATACAATTAA GAGTGCTAGC GAAGTAGATG CTATAGTCGA 


AGAGGCATTA 


3120 




GCACAAGATG TACCAACGAT TGTAGATGTA TATGTTGATC CTAATGCTGC 


GCCATTACCA 


3180 


25 


GGTAAAATTG TAAATGAAGA AGCGCTTGGT TATGGTAAGT GGGCATTTAG 


ATCAATTACT 


3240 


GAAGATAAAC ATTTAGATTT AGATCAAATT CCACCAATTT CAGTGGCAGC 


AAAACGTTTC 


3300 




TTATAACTGA TTTAAAGGTT ATCACAATTG AATTGAACTA TAAAAACGGT 


AATTTCTATT 


3360 


30 


TCAACAAAAT GGGAATTGCC GTTTTGTTTA TTTATCACAA ATGATCGTAC 


TGAATTGATG 


3420 




ATAAAATTGT GAAAAAGTTG TTGAAAACGC TTTTACAAAT ATGTATAATA 


GCTATGAATT 


3480 




AGATATCACT TGCGTGTTAC TGGTAATGCA GGCATGAGCA AAGAACCGCA . CTATGAGAAT 


3540 


35 


AGTCTTGTTT GTTCATGCCT GCTTTTTTTG TACATGGAAG CGGAAATTGA 


GATAGGGGAT 


3600 




GTTTETATGT TTAAGAAATT GTTTGGACAA TTGCAACGTA TCGGTAAAGC 


ATTAATGTTA 


3660 




CCTGtTGCGA TTTTACCAGC AGCTGGTATT TTATTAGCGT TTGGTAACGC 


AATGCACAAC 


3720 


40 


GAACAATTAG TAGAAATTGC ACCATGGTTA AAAAACGATA TCATTGTAAT 


GATTTCGTCG 


3780 




GTCATGGAAG CAGCAGGACA AGTTGTATTT GATAACTTGC CATTATTATT 


TGCAGTTGGT 


3840 




ACAGCACTTG GATTAGCAGG AGGAGACGGT GTTGCAGCAT TAGCAGCGCT 


AGTAGGTTAC 


J7UU 


45 


TTAATTATGA ATGCAACAAT GGGGAAAGTG TTGCACATTA CAATTGATGA 


CATTTTCTCA 


3960 




TATGCCAAAG GGGCAAAAGA ATTAAGTCAA GCAGCGAAAG AACCAGCACA 


TGCTTTAGTA 


4020 




TTAGGTATTC CAACGTTACA AACGGGTGTG TTTGGTGGTA TTATCATGGG 


TGCTTTAGCC 


4080 


SO 


GCATGGTGTT ACAACAAATT TTATAATATT ACACTACCAC CATTTTTAGG 


ATTCTTTGCA 


4140 
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AGCTTTGCGT 


ggccaccaat 


TCAAGATGGA 


TTAAATAGTT 


TATCGAATTT 


CTTATTAAAT 


4260 




AAAAATTTAA 


CATTAACAAC 


GTTTATATTC 


GGTATTATTG 


AACGCTCATT 


AATTCCATTT 


4320 


s 


GGTTTACATC 


ATATTTTCTA 


TTCACCGTTC 


TGGTTTGAAT 


TCGGAAGTTA 


TACAAATCAC 


43B0 




GCAGGTGAAT 


tggttcgtgg 


TGACCAACGT 


ATTTGGATGG 


CACAATTGAA 


AGATGGCGTA 


4440 




CCATTTACTG 


ctggtgcatt 


TACTACTGGT 


AAATATCCAT 


TTATGATGTT 


TGGTTTACCA 


4500 


10 


GCGGCGGCAT 


TTGCTATTTA 


TAAAAATGCA 


CGACCAGAAC 


GTAAAAAAGT 


OGTGGGTGGT 


4560 




TTAATGTTAT 


CAGCAGGATT 


AACTGCATTT 


TTAACTGGTA 


TCACTGAGCC 


ATTAGAATTT 


4620 




TCATTCTTAT 


TTGTAGCACC 


AGTACTTTAT 


GGAATTCACG 


TATTATTAGC 


TGGTACATCA 


4680 


15 


TTCTTAGTAA 


TGCATTTATT 


AGGCGTTAAA 


ATTGGTATGA 


CATTCTCAGG 


TGGTTTCATA 


474 0 




GATTATATTT 


TATATCGTTT 


ATTAAACTGG 


GATCGTTCAC 


ACGCATTATT 


AGTTATTCCA 


4800 


20 


GTCGGTATTG 


TATATGCTAT 


CGTGTATTAC 


TTCTTATTCG 


ACTTTGCAAT 


TCGTAAGTTT 


4860 


AAATTGAAAA 


CACCAGGTCG 


TGAAGATGAA 


GAAACTGAAA 


TTCGTAACTC 


TAGTGTCGCA 


4920 




AAATTACCAT 


TTGATGTCTT 


AGATGCAATG 


GGTGGAAAAG 


AAAACATTAA 


ACATTTAGAT 


4980 


25 


GCATGTATTA 


CACGTCTACG 


CGTAGAAGTG 


GTTGATAAAT 


CAAAAGTAGA 


TGTAGCAGGT 


5040 


ATTAAAGCTT 


TAGGCGCATC 


AGGTGTATTA 


GAAGTTGGAA 


ACAATATGCA 


AGCTATCTTT 


5100 




GGTCCAAAAT 


CAGATCAAAT 


TAAACATGAT 


ATGGCCAAGA 


TTATGAGTGG 


TGAAATTACG 


5160 


30 


AAACCAAGTG 


AAACGACAGT 


GACTGAAGAA 


ATGTCAGATG 


AACCAGTTCA 


CGTAGAAGCA 


5220 




CTTGGAACAA 


CAGACATCTA 


TGCACCAGGT 


ATCGGTCAAA 


TCATTCCATT 


ATCAGAAGTA 


5280 




CCTGATGAAG 


TATTCG CTGG 


TAAAATGATG 


GGTGATGGTG 


TTGGCTTTAT 


CCCTGAAAAA 


5340 


35 


GGTGAAATTG 


TAGCACCGTT 


TGATGGTACA 


GTGAAAACAA 


TCTTCCCTAC 


GAAACATGCG 


5400 




ata<3gattag 


AATCTGAAAG 


TGG CGTCGAA 


GTACTTATTC 


ATATTGGTAT 


CGATACAGTG 


5460 




AAACTGAATG 


GTGAAGGATT 


CGAAAGTCTG 


ATTAACGTTG 


ATGAAAAAGT 


AACACAAGGT 


5520 


40 


CAACCATTAA 


TGAAAGTGAA 


TTTAGCATAC 


TTGAAAGCAC 


ACGCACCAAG 


CATCGTTACA 


5580 




ccaatgatta 


TTACAAATCT 


TGAAAATAAA 


GAACTTGTCA 


TTGAAGATCT 


ACAAGATGCT 


5640 




gatccaggta 


AGCTAATTAT 


GACAGTCAAA 


TAATGATTAA 


AAATGAAACA 


GCATATCAAA 


5700 


45 


tgaatgaact 


TTTAGTCATT 


CGTAGTGCGT 


ATGCGAAGTA 


GCGAGTTGAA 


AGAGAATACG 


5760 




ttacaaaagg 


CAGTAGCTTA 


AAATG AAG CT 


ACTGCCTTTT 


TAGTGCGCAA 


TGATGTATAG 


5820 




CAGGTGTGTT 


GATGrTAATA 


AGTTAAATAT 


TAGTGTTAGA 


TATAGAAAAC 


ATTGCTTATG 


5880 


50 


TTTTTGTCAC 


ATTTTAGAAA 


AATGCATCTT 


CGCGACTAGC 


CAAATTAATA 


GTCTCATTGA 


5940 
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AATAAATTAA 


CATGATTTTA 


AATCTATTTG 


TAAGATAAGG 


AGATTTGTCA 


TTATGACAAC 


6060 




AGAAGGTCTA 


TTAGTTGCAG 


AGAAAGAAAT 


CGAAGTGAAT 


GGTTACGACA 


TTGATGCGAT 


6120 


s 


GGGTGTCGTT 


AGTAATATCG 


TTTATATTAG 


ATGGTTCGAA 


GATTTGAGAA 


CAjGCGTTTAT 


6180 




TAATCAGCAC 


ATGAATTACT 


CAACAATGAT 


CAATCAAGGC 


ATTTCACCTA 


TACTTATGAA 


6240 




AACGGAAGCA 


GAGTATAAAG 


TACCTGTCAC 


AATACATGAC 


AAACCAGTAG 


GTOC3TPATTTA 


6300 


10 


CTTAGTTAAA 


GCAAGCAAGA 


TGAAATGGGT 


\*> • * A V» ^> »nJ + + &. 


GAAATTGTGT 


CCGCACATGG 


O J O W 




CGTGCATTGT 


ATTGGTACAC 


AGACAGGCGG 


TTTTTACAGA 


TTGAGTGATA 


AGAAGATAAC 






CTCTGTGCCA 


CAAGTGTTTC 


AAGAf^ATTTT 

JWIUnwtA X X X 


AGCAACAAAA 


TAATGAfTTTf* 


**\X X X XnMMftX 




15 


ATAAAAAGTA AGAAGGTGTT 


VvW/wu%xwx x 


xtxvt7\_/vlX inn 


*\X J-x\3 *TJ X*~\3f\ 


AUiJil XV»VAi 1 


(TCj ft 
034 U 




Winl X lAl *\m 


ATCAATATCC 


xl X A/%\9V«nV3 X X 




l\9V.uVA3nlUn 




C.C ft ft 

bbUO 


20 


X\j X\mJxx u<wL\j 


TTTTACCACA 






v-A 1 A x \- ULAA 


TGTGCCATTA 


6660 


vjV- 1\3 1 \xfVX x a 


ATCAAAGTCA 




ATTGCTGGAG 


JV R'l'l'a » 54 'PUT* 

AA1 lAAAlAi 


TTTCaCTGTA 


6720 






TAATTTTTAT 




GAAATGCATC 


GTCAAGGGCG 


TTTTATCGAT 


6780 


25 


ATGCAACGTT 


TTGAACATCA 




ATGAATGATA 


GTGTAAATAA 


CGATGTCGAT 


6840 


GAGCATTAAT 


ATCGCAAATG 


ATTAGCATTG 


CTAAGATTAT 


GTAGACATCA 


TAACTTATTT 


6900 




CCCAGTAAAT 


ATTGGTAGTA 


All At»AA 1 (JA. 


GCATGGTACA 


GTAGAACTAT 


AGTAGAAATC 


6960 


30 


ATCAAAGAGG 


AGTGACGACA 


AA 1 V^jTAAA 


AAATGGTCTA CACTTGCGTT 


TGGATTTTTA 


7020 




GTTGCAGCAT 


ACG CACAT AT 




GAAAAACGCA 


GTGTGAAAAG 


TTATATGTTA 


7060 




GAACAAGGTA 


TACGATTATC 


TAGAGCTAAG 


CGTCGTTTTA 


TGTATAAAGA 


JA A f*f~*f* 7\ TV" 


7140 


35 


AAAGCATTAG 


AAAAAATGGC 


GCCACAGACA 


GCAGGCGAAT 


ATGAGGGAAC 


lAlWiu 


7200 




TTTAAGATGC 


CAGTAAAAGT 


GGATAAGCAC 


TTCGGTTCAA 


CCGTTTATAC - 


v^Vj 1 XAAUiA 1 


70C ft 




AAACAAGATA 


AGCATCAACG 


CGTTGTATTA 


TATGCACATG 


GAGGCGCATG 


V»X lUwinunL 




40 


CCACTCAAAA 


TTCATTTCGA ATTTATTGAT 


GAACTTGCAG 


AAACACTCAA 




7380 




ATCATGCCAG 


TATATCCGAA 


GATTCCGCAT 


CAAGATTATC 


AAGCGACGTA 


j rVi , [ t fii "'i " 1 " I ~ I ~ I ' 

4> %J XV7\< A A X X X 






GAAAAGTTGT 


ACCATGATTT 


ATTGAATCAA 


GTAGCAGATT 


CTAAACAAAT 


CGTTGTAATG 


7500 


45 


GGTGACTCTG 


CGGGCGGTCA 


AATTGCTTTA 


TCATTTGCTC 


AATTGTTAAA 


AGAAAAACAT 


7560 




ATTGTGCAAC 


CAGGACATAT 


TGTATTAATT 


TCACCAGTTT 


TAGATGCAAC 


GATGCAGCAT 


7620 




CCTGAAATTC 


CTGACTACTT 


AAAGAAAGAC 


CCAATGGTAG 


GTGTGGATGG 


CaGTGTGTTC 


7680 


50 


TTAG CTGAAC 


AATGGGCAGG 


GGACACACCT 


TTAGATAACT 


ACAAAGTATC 


ACCAATTAAT 


7740 



55 
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w 



15 



20 



25 



45 



SO 



CCAGATOCTT TGAACTTATC GCAATTGTTG AGTGCGAAAG GTATCGAACA TGACTTTATA 7860 
CCTGGATATT ACCAATTCCA TATTTATCCA GTATTTCCGA 7900 
(2) INFORMATION FOR SBQ ID NO: 139: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1984 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
<D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 139: 

GTCTAAATAA ACAAAATTAT CATTGATTaC TGAACTGGCA TTTCGAAGTA ATGCTTCAAT 60 

ATCATTCGAA TATTTCTTCA ATTTATGATT GTGAAATAAT TCTTGCATCA AAAATGGTCT 120 

TTGGTCACAT GAATGTGCAT CTGAAGCTAC AAAATGAGCC AAATTACATT CTATAAATTG 180 

TAATGATAAC TTTTGAATGT TTTTACCAAA TCCACCAACT AAAGAACTCG ATGTTAATTG 240 

ACTCAGTGCC CCATTTGCAA CCAATTCATA TAATATTTCC GGATTTTTGG CGATACTTCT 300 

ATTTCTTTCA GGATGTGCAA TGATTGGTAT GTAACCTCTC GATTGTATTT CAAAAAACAA 3 60 

TTGTTTTGTA TAATGTGGTA CTTCGCCCGT TGGAAATTCA ATTAATAAAT ATTTCGAACG 42 0 

ATTAATACCT TGAATACTAC CATTATCTAA GCCTTTCAGA ATCGAATCTG TAATTCTAAT 4 80 

3Q TTCTTGCCCG GGAAATAATT TAATATCCAA TGCTTGAACT TCTGGATGCG TTCTTAACTC 54 0 

CGCCAATTTC ACAAGCACTT GTTGAAATGT ATT AT CAT AT CTCGGATGCA AATGATGAGG 6 00 

TGTCGCTACA ATACTTGTTA CACCTTCATC CTTAGCTTGC TTTAATAGTG CAATACTCTT 660 

35 TTCAATTGTT TTAGGACCAT CATCTATATC AACTAATATA TGGTTATGAA TATCAATCAT 720 

G ATT CAT CAG TCCCATAATA TGCATAGTAA CTAGCACTTT TATCTTTAGG CATTCTATTT 7 80 

AAGACTACAC CTAATAATTT AGCACCTGTT GCTTCAATAA GTTCTTTTCC TTTTTTAACT 84 0 

40 TCATCTCTAT T ATT ATTTT C CGAATTAACT ACGTAGACAA CATTGCCGGT AAACTTTGAA 900 

AATAATTGCG CATCTGTAAC TGTGTTCACT GGTGGCGTAT CGATAATTAC AAAGTTATAA 960 

TTCATCAATA ATGTGTCATA CAAATTTGCA AATGCCCTTG ATGTAATTAA CTCTGACGGA 1020 

TTCGGTGGGA TTGGCCCAGA CGTCAAGACG TCTAAATCTT GAATTTCAGT TGAGATAATA 1080 

CTGTCTTGAT AAGTTGACCA ATTTAGCAAT AAACTTGATA GGCCTTCATT GTTTGGCAAA 1140 

TTAAAAATAT AATGCTGCGT AGGTTTACGC ATATCCCCGT CTACGATTAG TGTTTTATAA 1200 

CCTGCTTGCG CAT ATG CAAC TGCTAAATTT, GCTGCAATTG TAGACTTACC TGCGCCTGGT 1260 
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10 



is 



20 



25 



GATCTTATGC CTCGAAATTT CTCOCTAATA OOTGACTTTO QTTGTTCATG GACAATTAAA 1380 

CTTGATGTAC TTCyTCGTGT ATTCGTCATG GTAATTCCTC GTAAATTAAA ATTTTTGTAT 1440 

TGAACCTAAA ATAGGTAATC CTAGTTGCGA TTCAACATCT TCTTCTGTCT TAATACGCTT 1500 

ATCTAATAAT TCTTTTAAGA AAATAATCAA TATTGCTAAA ACAATACCAA CAATAATGCT 1560 

GATAACTAAG TTGACAGATA CTATTGGAGA TACTTTTACA GCATTATCAT GTGCTGAGGA 1620 

AAGTATCGTA ACATTATCAA CACTCATAAT TTTAGGCATG TCATGAGCAA AAACTTTAGA 1680 

TATTTTATTA ACAATTTTGT CAGATTCAGA TTTATTCCCA GTGGTAACTG ATACAGTAAT 174 0 

AATTTGAGAG TTTGTTTGAT TGGTTACTTT TAAAAATGAA TTCAACTCAG CTGTTGAATA 1800 

CTGACCATCA AnTTCTCTAG ATACTTTATC TAGAATTCTA GGACTTTTGA TAATTTCCGT I860 

ATATGTATTA ACAGACTGCA AACTACTTTG AACATTTTGG AAAGCTAAAT CACTTGAGGA 1920 

CTTTTTCATG TTCACTAATA TTTGAGTAGA AGCAGTATAT TTGTCAGGCA TAACAAAAAA 1980 

GGTT 1984 
(2) INFORMATION FOR SEQ ID NO: 140: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6272 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 140: 

CAAATCCCTT GGTGATGAtA AAtGtATTGC TGTGTAGCCA AATAATCTTG GTATATATGA 60 

35 CTGACGTTCA ACAACAGCTT GCAATCGTTT CGTTGGTACA GTTACTTTCT TCTTGTTAAA 120 

GAGACCATAT TCAATTTTAA GTTGCTCATT TTCAAGCATC ACCGAAAAGC CATAAAATCT 180 

TATCATTGTT ATAATCGTTC CAATAATATA TGCCACTATT AATACTAGTA AAATGATGAT 240 

40 TAATACTGAA ATACTTACAA TTTGAACCCA TTGACTAATT TCATGATTTA GCTTCGACCA 300 

TGGGATCAAC TCTCTTACAG CCCCGTAAAT CGGTACTAAA GCTGCTAACG TTACACCAAT 360 

GGCGCCACTG GTCATTGCCA TAAATAGTGA TTCTTTAAAA TTCATCTGAT ATATAGGAAT 420 

GCGTTTATTT TTCTGATTAA GCATACTATC AGTGTTCTGC ACTTCATCTA AGCGACCTTC 480 

TGCGATGTCT TCCACATTAC CTTCAATGTC ATGATTACAG TTGTCATTCT TCTCAGCACT 540 

AGACTTTTGC GCCACTTCTG TCTTCAACTC TGTTTGCAAT TGATCAATAT ATCGTTCAAG 600 

ATATTCACCT TGTTTTTTCG AAATAACACT TAAGACAATA CCATCACTTG GTGTTTTGAT 660 



45 
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10 



AATACGTTTT ATATTTAATT CTTTACGCTT TTTATTAAAA ATACCTGTTG TTAAAATGAA 780 

ATAATTATCC tCAATCCAAT ATCGCGTGTT CATAATTCCG ACAATTTGAG AAATGTATGA 840 

TATTAAAAAG AATACAAATA CAATACCTAT CCATAAATAT GATTCGGGAT TCGTATAATC 900 

AAAATCTTTC AATTGAAAGA TAATGAAAAT AAAAAAGACG ACTATGTTTT GTTTGATAGC 960 

ATTGATTATG CCATTAAAAT ATGAAATCGG ATGTAATTTT TGAGGTTCAG ACATCACTTT 1020 

CAACCCCTCT CAAATTCGAC ATAGTTCTCT CTTCGATTAT TTTAACATCG TCATGAGACA 1080 

TCATCGGTAA ATAAATAGTA TGACCTGCAG TCATAAATCC AACTTTATAC AAATTAAGCA 114 0 

T5 CTTTACTAAT TGGATTAGAT TTAATCOACA AGTATTGTAA ACGTTCAATT CGACTCGTTT 1200 

CTTCTTTATA TATAAAAAAT GATGTACGAT ATTGTACACT TAGTTGATCA ACTTTATAAA 1260 

AGCGACAATG ATATTGCCAT AAAGGCTTAA TAAATAATTT TAATGTACTC AGAGCACCTA 1320 

20 AAACCAACAA AATATAAAGT AAGTAATGTG GCCATTCAAA TCTTAACCAT ATAAAATAAA 1380 

AAATGACATA CACAGCTACA CTCAATATAA ATTCTAAGCC ATTCGTAATG TAGTAATACA 1440 

ACAATGCTGA CTTAGGACTC TTAGTCAACT TAGTATAATC TGACATATAC CCCTCTCCCC 1500 

25 

AAATAAAAAA TTATACGGAT TTATAATCTA TTTCATTTTA TTTTTATATG ATGATAATTA 1560 

TAGCATATGG AATATTTCAT G CTAATTT AT TCTTCCTAAA GGTACATCTA AAAATTTAAT 1620 

^ TAAGCAGAAA GTGCTTGAAT TGCTAAAAAG ACACCATGTT ATAATTTTAT CAACATGATG 1680 

CCTTTCATCT ATAATCAATC TTTCATCTTA TCAAGAGCGA TATTTAGTTC AAGCACATTC 174 0 

ACATAATCAT TTGTTAACAC ACCACGCTGC TTACGATGTT GAATCAAGTC GGCCACTCTT 1800 

35 GAAGTAGATA CATGACGAGC ATCAGCAATA CGAGGTGCTT GCTTCAATGC ATTTTCGACC 1860 

GTAATATGCG GATCTAAGCC CGACCCAGAA CTTGTTGCAG CATCTATTGT TACATTTGAA 1920 

TTCOCAAATT TAACATGATG TTTCATGCGT GCTATTAATT CGGTGTTTCC ATTCGATTCA 1980 

40 TTACTTCCAC CTGAAGATAC GCCGTTTTTA TATAATTTTT CAGGATTCAT ATTATAATCA 204 0 

ACTGCACTCG GTCTCCCGTG AAAATATCGT GTCTCTGTCC AGTGCTGTCC AATCAATTTT 2100 

GATCCAACTA TACGATTGTC ATACGTAATT AAACTGCCAT TTGCTTGTTG ATAAAAAAAT 2160 

ATTTGACCAA TTAACGTGAT AGCTAACGGG AATAAAAATC CACATAATAC CATAGTTATT 2220 

ATCGTTAAAC AAATACTATT TCTTATCGTA TTCATGGTAC AGGCTCCTTC CTCTTTACAC 22 80 

AAAAAATTGT ACAATCATAT CTATTAATTT AATGCCTAAA AACGGGACGA TTAATCCACC 234 0 

TAATCCATAA ATCAACATAT TATTTATAAA GATTCTATCA ATG CTGTAAC CCTTTACTTT 24 00 

TACACCTTTC ATGGCAATTG GAATTAAGGC AACAATGATT AATGCATTGA ATATCAAAGC 24 60 
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AATTGTTGAC ATCATTAGTG CAGGTAAAAT TGCAAAGTAT TTTGCTACGT CATTAGCCAA 2580 

ACTAAATGTC GTTAATGCAC CTCTCGTCAT TAATAATTGT TTGCCTATTT TTACAACCTC 2640 

5 

TATTAACTTT GTAGGATTCG AATCTAAATC AATTAGATTA GCTGCCTCTT TAGCACTAAT 2700 

TGTCCCTGAG TTCATAGCTA ATCCTATATT CGCTTtGTGc tAGCGCAGGT GCATCATTTG 2760 

TACCATCTCC TGTCATCGCA ACAATATGGC CTTTCGCTTG TTCATCTTTG ATGACTTTAA 2 820 

10 

TTTTATCTTC GGGTTTACAC TCTGCAACAA ATCTATCAAC CCCGGCTTCT TTTGCAATTG 2880 

TAGCTGCTGT TAAAGCATTA TCACCTGTAC ACATAACTGT TTCAATCCCC ATTTTTCTCA 2 940 

15 ATTCAGTAAA TCGTTCTACA AGACCATCTT TAATCACATC TTTTAAATAA ATCACGCCAA 3 000 

GCATGACATT GTTTTCAATG ACTATTAAt G GnGTGCCACC TTTACTCGAT ACATCCATAC 3060 

AGAGAGACTC AATATTAAGA GGAATATTGC CTTGTTGTTG TTTGACAAGA TTTATCATAC 3120 

20 TATTAGGTGC ACCTTTGAAT ACCGATATTT CATTTGTAAT GATTCCGCTC ATTCTAGTTT 3180 

CAGCTGTAAA AGGCTTATAT GTGCCATCAA TGTCTTTAGG CAGCTCATTT ATATACATcT 3240 

GcttCGCTAA TCGTACAATA CTTTTTCCTT CTGGCGTATC ATCGTAGATT GATGACATAT 3300 

25 

AAGCAGCGAC TATCAATTTT TCAAGCATTT GTTGATTCAC TGGTAAAAAT TCACTAG CGA 3360 

TTCGATTGCC ATAAGTGATT GTGCCTGTCT TGTCTAAAAT CATTACATCG ACATCTCCAC 3420 

ATACTTCTAC AGCACGCCCA CTTTTCGCTA ATACATTGAA TTGAGTAACA CGATCCATGC 34 BO 

30 

CTGCAATACC AATCGCCGAT AACAAACCAC CGATTGTCGT TGGTATTAAA CATACTGTTA 3540 

ACGCAATGAG CATCGCAATA GGTAAAATTA AATGCAGGTA AGATGCTATT GGATATAACG 3600 

35 TTACAATAAC GACTAAAAAT ATAATTGTTA ACGTTGTTAA TAATGTAAAA AGTGCAATTT 3660 

CATTTGGTGT TTTATTTCTT TCCGCCCCTT CAACTAAGGC AATCATTTTA TCTAAAAAAG 3720 

ATGTACnCGC TTCACTCTCA ACACGTATTT CTAACCAATC AGATGTTACA AGTGTACCGC 3780 

40 CAATGACTCC ATCAAAATCG CCACCTGATT CTTTTATCAC AGGTGCAGAC TCACCAGTAA 3840 

TTGCAGATTC ATCAACGGTT GCTAATCCAT TTATTACAAC GCCATCAGCA GGGATTGTTT 3900 

CTCCATTTTC TACCCGAATA TTTTGTCCGG CTTTTAACTC TGTGGCGTTC ACTATCCGAT . 3960 

45 

ACGCACCATT TTCTTCTATC AATCGAGCAG TTAAATTTGA TTGTGCTTGT CTTAAACTAT 4020 

CAGCTTGCGC TTTTCCACGA CCTTCAGCAA AGGCTTCTGA AAAATTAGCA AACAATATAG 4080 

TTATTAATAA TATGATAAAA ATTGTAATCA AATAACCTCG CGATAGATAG CTAGTTCCAA 4140 

50 

ATATGTCAGG AAAACATATT AATATCAACG TTAAAATCAT TCCAACCTCA ACGACAAACA 4200 

TTATCGGATT TTTTATTAAT TGTTTAAGAT TCAG CTTATA AAAACTCATT TTCAAAGCTT 4260 

55 
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TTTATTTTAA AGTTAAAAAT TCACCAATAG GACCAAGTAA TAGTACTGGA ATAAATGTCA 4380 

AACCACTTAG TAAAACGATA AATACGATTA GTGATACGCC AAAATAAGGT TTATCAATCG 4440 

5 

CTATTGTATA TTTATCTTGA TGGTATGATT TTTTATTCAC TAAACTTGAT GCAATCATTA 4500 

ATTGCAAAAT AATTGGTATA TAACGAGAAA GCAACATAAT GATTCCTGTA GAGATATTCC 4560 

AGAATGTTGT ATCATCTTTC AGTCCTTCAA ACCCTGATCC ATTGTTCGCA GCAGCTGATG 4620 

10 

TCATTTCATA CATAACTTGT GAAATACCAT GAAAAGACGG ATTCGTtATa CTTtCACTTG 4680 

CTCCAGGAAT CATAAAAGCA AGTGCTGAAA ATACTAAAAT TAAAATTGGG TGTATGAGAA 474 0 

1S AGACTAAGAC AATACATTTC ATTTCACGGG CGCCAATTGG CATATTTAAA TATTCTGGTG 4800 

TTTTACCAAC CATCAAACTG CATATAAACA CCGTCAGTAA GACAAATATC AATAAATTCA 4860 

TGAGTCCTAC GCCTTCGCCA CCAAATACAA CATTTAGCAT CATTAATACC ATTGGTCCTA 4920 

20 ATCCACCTAT AGGCGTTAAG CTATCATGCA TGTTATTAAC AGAACCCGTT GTAAATGCCG 4980 

TCGTAATAAC TGTAAATAGT GCTGACAAAC CTGCTCCAAA CCGTACCTCT TTACCTTCCA 5040 

TATTCGGTCC AT AAATG CCT AAATTCGCTA GTATTGGATT ACCACGATAC TCACTCCACA 5100 

25 

TAGTTAATGT AAGAATTGCT ATAAAAATGA AAAACATTGC GACAAATAAT AT CAACGCAT 5160 

GACGATGTAC TCGTTTACCA TGT CTACTTA ACATGCGACC AAATAAGAAC AACATTGACA 5220 

TAGGAAGTAA CATCATACTG CCCATTTCTA TAAAATTGCT CCAAATATTT GGATTTTCAA 52 BO 

30 

AAGGTGTTGC AGAATTTCCT GCTAAAAATC CTCCACCATT CGTACCAAGA TGTTTTATTG 5340 

ATTCAAGTGA TGCAATAGGT CCAAATGCAA TATGTTGAAT ATGTCCGCTT AAAGTCCGAA 54 00 

35 TCATTAAATT AGCATGCAAC GTTTGTGGTA CaCCTTGAGT CATCAATAAA ATACTAATTA 54 60 

AACATGATAA TGGTAAAAGT ACTCGGACAA TAAACCGAAC AATATCTTGA TAAAAATTAC 5520 

CAATCATATT AGTTAATCCA GTTAAACGTC TCAACATCGC TATACAAACG GOGTAACCTG 5580 

40 ATGCACTAGA TGTAAACATT AAATATGTCA TTACAAT CAT TTGCGTTAAA TATGTCACAT 5640 

CTGaTTCACC GTTATAGTGT TGtAAATTAC TATTTGTTAA AAAAGATATT GCTGTATTAA 5700 

ACGCTAAATC TATCGATTGG TTTAAATTAT GATTTGGATT TAAAAAAAGC CATTGCTGAA 5760 

45 

CT ATT AG CAA TACAAATGTT ATAAACCCCA TAAATCCATT AAATGCCAGA AAATGTTTGA 5820 

CATATGTTTT AGCTGACATG TGTTCTAAAT CTGTGCCGAT AATTTTAAAA CACATATTTT 5880 

CAAATCTAGT AAATATTAAA TCTACTCTTG ACGATTGCAC CAATGCTACG CGATATAGAT 5940 

50 

ATCCACTAAA AACATACGTA ATCATAACCA TCATTGTTAG AAACAAAATT ATTTCCATGA 6000 

TAACCCTCAC TTAATATATT TCTAAAATTT TTCACTACGA ATTAAGGCAT AAAATAAATA 6060 

55 



738 



EP0 786 519 A2 



ACACAACAAC ATCGTAACAA CTTGTTTATG AGAGAAATnT TAATTTTCAA ACTTAGTTAT 6180 

TAAGAAAnCA TTAAGATGTG TATGCAGAAA TAAATTTTAT AGCATTTAAT TGTGAAGAAT 6240 

5 ATTATGATAT TGCTATCGAG GTGAAGGTTA TG 6272 

(2) INFORMATION FOR SEQ ID NO: 141: 

(i) SEQUENCE CHARACTERISTICS: 
io (A) LENGTH: 1976 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 141: 



30 



35 



AO 



45 



SO 



AAATGATGTT 


TTACAATAAA 


TATAnAAACG 


TATCAACATA 


TATCATCATA 


TTTTTAGTTT 


60 


CAAGTGCAGC 


CTTTGCAATA 


TTCTTGTTAA 


GTGCGnACAT 


TAGTGCTCAC 


TCGGAACAAG 


120 


TGTACGAAAT 


GACTGACCAT 


CAAATTAAGA 


ACAATACGAT 


AAATAAAGCA 


TACGAACATA 


lou 


AAGACCCTAC 


AAACAATAG C 


O ft 9k Oik Ik H Oik 

GAACAAAGAG 


ATGGGAAAGT 


GTTCGCTTTA ATAAATTGAT 


Oil 


ACATTGTCAC 


AACG TTATTT 


TG CCTATTTT 




CGTTTTTTAT 


TACwTTTTTG 


inn 


CTGATsTTAA 


ATTTGTTATA 


TTTTGTTAAA 




GATTGAATAA 


ACAAATTGAA 


J D VJ 


gctagutttt 


TTAATTGAGT 


AATTCTGATT 


TGAATATCGA 


AAGAATTAAC 


GAGTTAGCTA 


420 


AAAAGAAAAA 


AGAAGTAGGA 


TTAACTCAAG 


AAGAAGCAAA 


GGAGCAAACA 


GCCTTAAGaA 


480 


AAGCTTATCT 


TGAGAGTTTT 


AGAAAAGGGT 


TTAAACAACA 


AATTGaAAAT 


ACTAAAGTAA 


540 


TTGATCCAG r 


AGGTAATGAT 


GTAACACCTG 


AAAAAATTAA 


AGAGATACAA 


CAAAAAAGAG 


600 


ATAATAAAAA 


TTAAATCACA 


AATCTGTAAA 


GAATTTTCTG 


ACATTATAAC 


TTGAAATAAG 


660 


TATtTTACTT 


ATCTTTTTAT 


TTTAAAATAA 


GTTATAATGT 


ATTTGATAAA 


ATTGAAGAAG 


720 


GGAAGATACA 


CAAGATGTTT 


AATGAAAAAG 


ATCAATTAGC 


TGTTGATACG 


CTACGTGCAC 


780 


TAAGTATCGA 


CACAATCGAA 


AAAGCGAATT 


CTGGTCATCC 


AGGATTACCT 


ATGGGAGCTG 


840 


CCCCAATGGC 


TTACACTTTG 


TGGACACGTC 


ATCTGAATTT 


TAATCCACAA 


TCTAAAGATT 


900 


ACTTCAATAG 


AGACCGTTTC 


GTATTATCTG 


CAGGGCATGG 


TTCAGCATTA 


TTGTATAGCT 


960 


TGTTACATGT 


TTCTGGTAGT 


TTAGAATTAG 


AAGAATTAAA 


GCAATTTAGA 


CAATGGGGTT 


1020 


CTAAAACACC 


AGGTCATCCT 


GAATACAGAC 


ATACAGATGG 


TGTAGAAGTT 


ACTACCGGAC 


1080 


CACTTGGACA 


AGGTTTTGCT 


ATGTCAGTAG 


G ATT AG CTTT 


ACAGAAGATC 


ACCTAGCAGG 


1140 


gAAATTTAAT 


AAAGAAGGAT 


ATAATGTTGT 


AGATCATTAC 


ACATATGTAT 


TAGCTt CTGA 


1200 
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75 



20 



AAGTAAATTA 


GTTGTTTTAT 


ACGATTCAAA 


TGATATTTCA 


TTAGATGGCG 


AATTAAACAA 


1320 


AGCTTTTTCT 


GAAAACACAA 


AAGCTCGTTT 


TGAAGCATAT 


GGTTGGAATT 


ACTTACTAGT 


1380 


TAAAGATGGT 


AATGATTTAG 


AAGAAATTGA 


TAAAGCGATT 


ACTACAGCTA 


AATCTCAAGA 


1440 


AGGACCAACG 


ATTATTGAAG 


TTAAAACAAC 


AATCGGATTT 


GGTTCACCGA 


ATAAAGCAGG 


1500 


AACTAATGGT 


GTTCATGGGG 


CACCTTTAGG 


TGAAGTTGAA 


AGAAAATTAA 


CATTCGAAAA 


1560 


TTACGGTTTA 


GATCCTGAAA 


AACGTTTTAA 


TGTTTCAGAA 


GAGGTATACG 


AAATTTTCCA 


1620 


AAATACTATG 


TTAAAACGTG 


CTAATGAAGA 


TGAATCTCAA 


TGGAATTCAT 


TATTAGAAAA 


1680 


ATATGCAGAA 


ACATATCCTG 


AATTAGCAGA 


AGAATTTAAA 


TTAGCGATTA 


GTGGTAAATT 


1740 


GCCTAAAAAT 


TATAAGGATG 


AATTACCACG 


TTTTGAACTG 


GGTCATAATG 


GTGCATCTCG 


1800 


TGCTGATTCT 


GGTACTGTTA 


TTCAAGCAAT 


CAGTAAAACT 


GTCCCTTCAT 


TCTTTGGTGG 


1860 


ATCAGCAGAC 


CTTGCTGGTT 


CAAACAAATC 


CAATGTAAAT 


GATGCAACTG 


ATTATAGTTC 


1920 


TGAAACACCT 


GAAGGtAAAA 


ATGTGTGGTT 


TGGTGTACGT 


GAATTTGCTA 


TGGGTGCT 


1978 



(2) INFORMATION FOR SEQ ID NO: 142: 
25 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7588 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 142: 
TAGTAGTATT TATTAAATTA TACGAAGGGA CCcAACACAG AAAATTCATT TTATTGAATT 60 

35 

TTACATTTAT GTGCCAAGTT GGGAAAAATG TCTTATTTTT TCaAAGTATT TAAAAGTAAA 120 
ATTACATGTT AATACGTAGT ATTAATGGCG AGACTCCTGA GGGAGCAGTG CCAGTCGAAG 180 
ACCGAGGCTG AGACGGCACC CTAGGAAAGC GAAGCCATTC AATACGAAGT ATTGTATAAA 240 

40 

TAGAGAACAG CAGTAAGATA TTTTCTAATT GAAAATTATC TTACTGCTGT TTTTTAGGGA 300 
TTTATGTCCC AACCTTTTTA GAATATTAAA TTTCTACAAT TTCGTCATCT TCAACAATAA 360 

45 AGCCCATTGT ATTGACGCTG TTATTTAAGA AAGTCAGAAT ATAACGCATT ACTTCATCAC 420 

GTTCTGGCTC ATTGTGAACC TCGTGGTAAA AACCTTGCCA AGCTTTAAAA TATAATTCAG 480 
GTGTTTGATA TTTTT CTTT A AACTCATCAA TTGCCCTAGT ATCAACAATT AAATCCTTCG 54 0 

60 TTCCATACAT TAATAGCGTT GGCATTGGTT GAATGTCATG AATATGAGCC ATCGTATCTT 600 

TCATCGTCTC ATTAATTGTA TTATACCAAT GATACGTTGC TTTTTTTAAC ATTAAACCAT 660 
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CATTAAAACG TGTGTCTTTT GAAATTTTAC CTATATTTCA AACAAGTTTA TCTTTACGAT 780 

TTTTTCCATT CTTTT G AAGT TCTAGCATAG GAGAAATTAA CATCATCCCC TCGATTGGCA 840 

ATTCTACTTT TTCAAGTAAA TTTAATAAAA TCAAACCGCC AAGTCCTACC CCTAATACAT 900 

AAGTAGGAAT TTTATATTCA TTAGCTATCT TTAACCAGTC TAOCAAACTT TCGTGATACG 960 

TTTGAAAGTT TTCAATTTGT CCTTTATTAG CTCTTGAAGT TTGACCTTGA CCAGGCAAAT 1020 

CTCCCATAAT CACATGATAG CCATTTCTTC TTAACATCGT AATAACATAT GCATATCTTC 1080 

CCGTATGTTC TAATATATTA TGAGCAATAA CAACGACGCC TTTCGCATCA TTTTCAGCTT 1140 

CCCACTTCCA CATTATTATA CTGCCCCTTT TTCATTAATC TTCAATAACA TAATTATAGC 1200 

AAATTCACTA TGTAGATTTC TATTTATAGT ATTATTGTTG TCCATATTAT TATATATAAA 1260 

TGAAATCAAC ATCAATAATA GTGTAATTAT ACATAATTAT TTTTGATTGT TTTTGATGAA 1320 

AACGCTTTCT CGAATATTTT TTTCATGCTA AACTTATTGT AAACACAAGG GTTTGGAGGA 1380 

GTAGCAATGG CACTATTAAA GAATTTTTTT ATCGGATTAT CTAATAATAG TTTTTTAAAC 1440 

AACGCAGCAA AAAAAGTGGG CCCACGTTTG GGCGCCAATA AAGTCGTTGC CGGAAATACA 1500 

25 ATTCCAGAGT TAATTAATAC AATCGAATAC TTAAATGACA AGAATATCGC TGTTACGGTA 1560 

GACAATTTAG GGGAATTTGT CGGTACAGTT GAAGAAAGTA ATCATGCTAA AGAACAAATT 1620 

TTAACAATTA TGGACGCGCT TCATCAACAT GGCGTAAAGG CACATATGTC TGTTAAATTG 1680 

AGTCAGTTAG GTGCAGAATT CGACTTAGAA TTAGCTTACC AAAATTTAAG AGAGATTTTA 1740 

CTTAAAGCAA ATACTTACAA CAATATGCAT ATAAATATTG ATACTGAAAA ATATGCTAGC 1800 

CTGCAACAAA TTGTTCAAGT TTTAGATCGC TTAAAAGGCG AATTT AG AAA TGTTGGTACT 1860 

GTAATTCAAG CATATTTATA CGATAGCCAC GAATTAGTTG ATAAGTACCA AGATTTACGA 1920 

TTACGTTTGG TTAAAGGTGC ATATAAAGAA AACGAATCAA TTGCATTTCA ATCTAAGGAA 1980 

GACGTAGATG CAAATTACAT CAAAATAATT GAACAACGTT TGTTAAACGC ACGCAATTTC 2040 

ACTTCAATTG CAACACATGA CCATCGCATC ATTAATCATG TAAAACAATT TATGAAAGAA 2100 

AATCACATTG AAAAAGATCG TATGGAATTC CAAATGCTCT ATGGTTTTAG ATCAGAGTTA 2160 

45 GCAGAAGAAA TCGCAAATGA AGGCTATAAT TTCACTATTT ATGTACCTTA TGGCGATGAT 2220 

TGGTTTGCGT ATTTTATGAG AAGATTAGCA GAACGCCCAC AAAACCTATC TCTTG CTGTA 2280 

AAAGAATTTG TGAAACCTGC TGGCTTAAAA CGTGTTGGCA TAATTGCAGC TTTAGGAGCT 2340 

50 ACAGTTATGT TAGGTTTAAG TACAATTAAA AAATTATGCC GTAAATAGAG CAAGACATAA 24 00 

ACAATAATTT AGGAGTCTGG AACAATAATC AATGTTCTAG GCTCCTAAAT GTTATATTCG 2460 
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TAGATTTTAA 


TAAATTAGCC 


ATTTCAATTG 


CACTTACTGC 


TGCTTCAGCA 


CCTTTATTGC 


2580 




CAGCTTTCOT 


ACCTGCTCTT 


TCCACAGCTT 


GTTCAATACT 


TTCAGTCGTT 


AAAATACGAA 


2640 


5 


ATATGACTGG 


TACATTAGTT 


TGATCATTCA 


CTTTAGAAAC 


ACCTTTCGCG 


ACTTCATTAC 


2700 




AAACATAATC 


ATAATGAGAC 


GTAGCACCGC 


GAATTACGCA 


TCCTAATGTA ATTACTGCAT 


2760 




CATAATTTCC 


TGATGAGGCT 


AATTTTTTAG 


CTACTAAAGG 


AATTTCAAAC 


GCACCTGGCA 


2820 


10 


CAAATGCTAC 


ATCAATATTG 


TCTTCATTAA 


CATCATGTCG 


AATCAAAGTA 


TCTTTTGCAC 


2880 




CTTCAAGTAA 


TCTTCCAGTG 


ATAAAATCAT 


TAAATCGACT 


AACTACGATT 


GCAACTTTCA 


294 0 


15 


AATCTTTTCC 


AATTAATTTA 


CCTTCAAAAT 


TCATGTTAAA ATCCTCCTAT ATTAAATGAC 


3000 


CCATTTTTAT 


TTTTTTCGTT 


TCCATATAAT 


CATGATTATG 


TACCX5TTTCT 




inert 




CTTCAATTCT 


TTCTGCAATA 


TCAATGCCAT ATTGTTTTAA TCCCTCAAAT 


1 1 AC 1 xCjOAx 




20 


TATTACTTAA 


TAAATTGATA 


•TY2TT/^n ATY2T 


TAAAATATTT 


1/vvtAl Llul 


GCAG CAATAT 


JlOU 




GATAATCTCG 


CAAATCTTCA 


TPAAAAPPTA 


ATfVT A a ATT 






3240 




c "J"i CTfMill *F 




GCGGGTAATT 

WWW X X X 


TGTTTAAPAA 

X V7 X X 


TPPTATGPPA 


CGACCTTCTT 


33 00 


25 


GAGGTAGATA 


A ATA ATf A*TY3 


CCACCATGTT 


CATTGATATA 


CTTCATAGAC 


VM-LX X x X 


33 60 




GAGCAC CACA 


ATP AP AA PGT 


TGACTATGGA 


AAATATCGCC 


TGTAAGgCAC 


GPAGAATGTA 


3420 




AG CGTACATT 


TT P A TP^TTflT* 


CGAATTGCAC 


CTTTTGTCAG 


TACAACTATC 


TCTTCATCTG 


34 80 


30 


TGTATGTCG C 


TTTAAAAPPA 


TACATATCAA 


ATGTTCCGAA 


ATCTGTAGGC 


ATTTTCACTT 


3540 




TTGCCTTAAA 


TTPAATTTPT 

X X V* — fwk XXX \^ X 


GGTTCTAATT 


TTTTACGATA 


TTCAATTAAA 


TCATCAATCG 


3600 


35 


TAATGATCTT 


TAATTGATGT 

X X X X \iJ X 


TTTTCTTTAA 


ACTTTTGTAA 


ATCTTGTCCT 


TTCGCCATCG 


3 6 60 


TGCCGTGATC 


ATT CAT AATC 


TCACAAATGA 


CACCAGCGGG 


CTTGGCACCA 


GTAAGTTTAG 


J / ^ u 




CTAAATCAAC 


AGCCGCTTCT 


GTGTGTCCAT 


TTCTAGCTAA 


TACGCCTTTA 


TCTTGTGCTA 


1 "7 ft ft 


40 


CTAATGGAAA 


TAAATGACCA 


GGACGATTAA 


AATCTTTAGC 


TTCACTACTA 


GGATCAATGA 


3840 




GCTTITTGGC 


AGTCAATGTA 


CGTTCATAAG 


CACTAATTCC 


TGTTGTTGTA 


TCTACATGAT 


3 900 




CAATACTCAC 


TGTAAATTGC 


GTACCAAAGA 


TGTCGGAGTT 


ATCATCAACC 


ATTTGTACCA 


3960 


45 


AATC CAAACG 


TTGTGCAATA 


TCTTTAGACA 


CTGGTGCGCA 


TATTAATCCC 


CtTGCTTCTT 


4020 




TCGCCATAAA 


ATTAATGGTA 


TTATCGTTCA 


TCCATTCAGT 


AACCGCTACT 


AAATCACCTT 


4080 




CATTTTCACG 


ATTCTCATCA 


TCTACTACAA 


TAATTGGTTC 


TCCATTTTTT 


AAAGCCATTA 


4140 


50 


AAGCACTGTC 


AATATTATCG 


AATTGCATGC 


TACCCCTCCt 


AAAAACCAAA 


TGCTCTTAAT 


4200 




TTATCTACAG 


ATAATTGGTC 


TTTATCTTTA 


TTTAAAATAT 


TTTCAACATA 


TTTAAACAAA 


4260 
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CTCGTTTCTG GAATAAGATG AATGTCAAAA CTGTTATCAT GCTTATCAAA TACCGTTAGA 4380 

CTAACACCAT CCACAGTAAT AGACCCTTGC TTAACTAACT GATTATTAAT ATGTTGGCTA 4440 

CATTGAATCG TAATAATTTT TGCATTGGCT GTTTCATTTA TTTTTGAAAC TGTTCCTAGT .4500 

TCATCTACAT GACOGAGGAC AAAATGTCCA CCAAACCTAC CGTTACCACT CATGGCACGC 4560 

TCTAAATTTA CTTCTGATTG TOGCTTAACA TCTGCTAAAT AGGTTTTATT TTCAGTGCCT 4620 

TTAATTACTT GAACAGTAAA AGATGTCTGA TTAAAATCAA TCACTGTTAA ACATGCACCA 4680 

TTAACACTGA TGGAATCACC AATATGCATA TCTGCCGTAA TCTTATGTGC TTCAATTTCA 4740 

ATCGTCCTGA CTGATTGACG AATTTGAACA CTTTTAACOA CACCTATTTC TTCAACGATG 4600 

CCAGTAAACA TGCATCATCA CTTCTTTCGT AAAGTTAATT TAACATTTTG ATTTAATAAC 4860 

TCGGAATGAA CAATTTCAAA TTGGTTCGCA TCTGGTATCT CAATCACATC ATTTGTTTGA 4920 

20 TAAAATTGAT AATTTCCAGA TCCGCCAATT AATTTCGGGG CATAATAGAG AATAAATTCA 4980 

TCTATATAAT TAGATTGGAG AAATTCTGAA GTAGTGGTTG GACCTGCCTC GACTAGCAAA 5040 

GTTCCAACTC CTCTTTTATA TAAATTGTGA AGAATTGTTG TTAAATCGCA AGACTTCAAG 5100 

25 TAAATAATTT CAATATGTGT TTGATTGGTT GTTAAATTTG GATTTTCAGT ATATATCCAA 5160 

ATTGGTGTTG ATTCATCTTG ATAAATTTGC TGATTAAAAT GAATATTCCC AGACTTAGAC 5220 

AATATTACTT TTATAGGGTT TTTTCCATCT TGAATACGTG TAGTATATTG TGGATCATCT 5280 

30 

AATTCAACTG TACGTCTTCC AGTTAACACT GCGTCGTGTC GATGTCTTAA CTTAT AGACA 5340 

TCTTGTTTAA CCTCTTTGTT AGTAATCCAT TGACTTTGTC CATTATCATT CGCTTGTTTA 5400 

CCATCTAAAC TTGCAGATAC TTTCACTGTA ATTTGTGGCA GTTGCTTTGC TTTTGCTTTA 5460 

AAAAAGTCTT GGTATAATTG TGATGCCCGT TCATCATCAA CGCATTCAAC CTCAATACCG 5520 

TGAGCCCGTA ACGTCTCATC ACCATGTGTG TCTAACGAAT TGTCTTTTGT TGCGTATACT 5580 

ACTTTTGCTA TCTTACAATC AATTATTTTG TTAACACAGG GTGGTGTTGA ACCAAAATGA 5640 

CTACATGGCT CTAACGTAAT ATAAATCGTC GCACCTTCAG CATTTTGTTG TGCCATATCA 5700 

AGTGCTTGAA CCTCCGCATG CTTGTCACCT TTTCTCAAGT GTGCACCAAT ACCAACAATC 5760 

45 CTACCTTCTT TAACTACAAC AGCGCCAACG GGTGGATTAA CACCTGTTTG ACCTTGTACC 5820 

ATATTTGCAA GTTGAATCGC ATAATCCATA AATTGACTCA AATGATCACC TCTATAAACA 5880 

AAAATCCTCA CATCATGAAT TAAGATGCAA GGAGaAAAAT TTATCGTTAA ATAAGCCTAT 5940 

60 TTGTACACAT TTTTACAAAT ACGCTACATT ATCTTTGTCG ATAATTAACA TTCTTTCTCC 6000 

CATCCAGACT TTAACTGTCG GCTCTAGAAT CTCACTAGAT CAGCCACTAA TATGAAACAT 6060 

SS 
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10 



is 



20 



25 



30 



35 



45 



50 



TTaTATATGA AATTGTTATA QATTATTTGA GTACGTAGTA TGTCAACTAC ATTTAAAATG 6180 

ATACTATATG TTTTCTGAAA AAACAATTAA TGACGGTTTT AATTTAATAT AAT CTGAGTA 6240 

CTATAGGCAT CTCATTGATA TGATTCTTAC TAACAGACAT TAAAATCAAA CCTTCAATTC 6300 

GTCTCTATAG AGCGTTCTCT TTATTATCTT CTAGTTACAA ATTATTGATT GtCACtGCGC 6360 

TGTTGTTGCT CATTCGATTC TAAAGCATCA TATAATTGAG ATACTGTATG CGCAACTTOT 6420 

TCTACAATCA TTTTCACACC GTTTCGTAGT TTATTAACAC CGTTTGTCAT TTGACCTATC 6460 

GCAATCATAT TTGTTAATGT TCCAAACCTT GGACTAATAA CTTGATTGGT TTCCGGAATG 654 0 

ATTTGTATGC CTCCCATTGG GTGTGCTTGT ACAATTTGTC TATTTTCAAG ATTTCTAATT 6600 

AATTGATCAT CTTGATCCAA TTCATTTAAA TGACTTTTTG CACCTGTCGC GTTAATGACA 6660 

ACATTATATA TGTCTACTGA TTCTTGGTTT TTGTATGAAA AATAATACAA CTTGCCATaC 6720 

ATGTTCACAT CTTCTAAATC TTTTTTCAAA ATTAAAGACT TATTTTCTAT TAATTCAATA 6780 

ATTAGTTCAG CAGTTCTTGG AGGCATTGGA TTTGAATTTA ATTGAATCAT CTTTGAGTAT 6840 

TTTTGATTAA ATTGATGTTG GTCTTCAATA CTTAAGCTAT TCCATATCCA ATTTAAATTC 6900 

TCTTTCAAAT GTTCAATCAT ACTTTGGAAA ATGCCCaTTT CTGTTGGACG CGCTAAATCA 696 0 

TACTTCAAAT CTGCAATATG ATTTCCTGTA CGTCTATGTA CTAATTTTTT AAAATCAATG 7020 

TCATATTCAG CACATTCTTT TAAAAATAAA GAAACTAAAG TATCAAGCGG TGCATTGCCG 7080 

AAATGATGTT TTTTAATGTC ATTTAATTTG TCTTTAGTTA AGTACTTGAA TGTCACGTCT 7140 

ATCATTGTAC CTCTTACACT TGGTAAATGA GCAGAACGAC TCGTCATAGT AATTGGTAAT 7200 

TTTGGATGAT GAGCAGCAAC ATAACGGACA ACATCTAAAC TGGCAAGGCC TGTACCAATA 7260 

ATCGCAATAT CGTCCAGTTC ATTTACTTCG TCTAACGTAT TATATGTTGG ATAAGG CGTA 7320 

gcGATATATC CTTTTTTACC CTTTAAGTTA TATGGATCAT GGTAGGCAAA TGTACCACAT 7380 

GTTAAAAATA CATAATCGTA CGCTTGCCAT GATTGTCCTG AATTTGTAGT ACATATGTAA 7440 

TAAGTTAAAT TCGTTTCATC GATATTAGAA TTTGTATAAA TCTCTTGAAC TTTATTATAA 7500 

TTAGTTGATA TATTTGGATA TTTTTTCGTG AACATAGATA AATAAGATTT CATATAATGT 7560 

CCGAATACAA ATCTCGGTAA ATATGCAG 759 3 
(2) INFORMATION FOR SEQ ID NO: 143: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10320 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 143: 

nCTAGGTATT TTAAACCTAA TCTAGATAAA CTAGCTTCGT AAGCAGCTGC TACATTTTCA 60 

CGACCGAAAT CCTCAAAATA TAATTTTGAA GTAATAAATA AGTCTTCTCT AGCAATACCA 120 

GTTGACTCCA ATCCGGCACG AATGCCAGCA CCTACTTGTT CTTCATTCCC ATAAACTTTT 180 

GCGGTATCAA TACTACGATA TCCTTGTTCA ATGGCATACT TAACACTTTC CATGCAATTT 240 

TCATCATTTT CCACACGAAA TGTCCCTAAA CCAATTTGTG GCATCGTGTT TCCATTATAA 300 

AATGTTTTAA CCTCCATAAA TATCGCCTCA CCTTTTTGAT GTATTATACC CTGTTATCAT 360 

AACAAATCTG AGTTGAATAC ATGAGAAAAA ACACTTAGAG CAATCAACCA CTAAAATTCT 420 

AGTAATATCT CTCAAATATT AATCAAATTG TAAAAGTAAT TCTGTTTAAT TTATGACAAA 4 80 

CTAAAAAAGC CGAAGTAACA ACATATAGTC ATCACTTCAG CCTAACATTT AATTGAATGA 540 

TTCAATTTTA TCCATCATTT GTTGTAAGTC TTCCACGTTG TATTGAATAC GACCATGGAA 600 

TACAAATTTG TTAAAGAACT CGTCTAATTG TTCAGCACCG ACAAGCACTT TGACAGCACT 660 

ATTTTGATTA TAATTTGAAA TCGTTACATC GCCTTCATTT TTAAGATTAA AGTATAAAAT 720 

25 TGAAGTTGGT GTATATTTGG CACCTAATTC TTTTTGTAAG TCTTCAGCCA ATTGTTTAAT 780 

CGCCTCAATT TGATCTGAAT AATTTACAAA TGATAATGAA CGTTTGTCAT CATTTTGATC 840 

CATCACAATA GTTTGCGGTC TAGATTTATC TAAATCCAAT GTATCAAATA CTTGTTCCAT 900 

30 

TGGTGGTAAA TCTTTAAATT GACCGCCACT AATACCATTA TAAACATGAC CTTTTAACAA 960 

TTGAGAATCA ATAATATAAA GACCAGTTCT TGTTAATACT AAATGACTAA TTCGTTCAAT 1020 

ATTATTAAAG CCATCCTTTG GTAAAAAGAT ATTTGCCATA ATGTGCATAT CTTCTGGTCG 1080 

AATTCGTTTT TCTTTAACTA ATCTTTCACG AATACCAATT AATCTCATGT CCGTTACATA 1140 

TTCACTATGA TTTTTCGAGA ACAATTTTAA TGCGTCAATC TCACGATCTT TTGTACTAAC 1200 

CATGTGATTA TAATCTTCTT GTTGTTTTGT AATTGTCTTT TTATTTTGAA TACGCTCTTT 1260 

CTCTAAAGCT TCTTCATGAG ACTTTTTAAT GTTTTGTTCT TGTTGTTCAT ACTTTTCTTC 1320 

TGTTTGTCGC TTAACTTTTT TCTTACTACC TAAGGCAACT AAAAAAAGGA CAAAAAAGAT 1380 

45 TAATGCAATG AgCTACTGCA ATAATGAGTC CAATGACTAT CGGTGAAGAT AAATCCATCA 1440 

CAACAACGCT CCTTTTTAAT ATATGAATAA CTTTAATTAT AATAGAaAAG CTAAAGATTT 1500 

TCGATACATA TTATCATTTA TATACCGAAA ATCTTTTATT TAGCTATATT CAATTCATCT 1560 

SO TATTATTTTA CTGCGTCTTT TAATTCTTCC ACTTTGTCTA ATTTTTCCCA TGGGAATAAG 1620 

ACATCTGTAC GTCCAAAATG ACCATAAGCA GCAGTTTGTT TGTAAATCGG TTGTTTCAAA 1680 
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AGTTGCCCTT 


CAGAAACTTT 


ACCTGTTCCA 


AATGTATCAA 


TTGCAATTGA 


CACTGGTTCT 


1800 




GCAACACCAA 


TCGCATATGC 


CAATTGTACT 


TCACATTGAT 


CTGCTAAACC 


TGCTGCAACA 


1860 


5 


ATATTTTTAG 


CCACATAACG 


TGCAGCGTAT 


G CAGCTGAAC 


GGTCTACTTT 


TGTAGGATCC 


1920 




TTACCACTGA AOCATCCGCC ACCATGACGT 


GCATAG CCAC 


CGTACGTATC 


AACAATGATT 


1980 


10 


TTACGTCCTG 


TTAATCCTGC 


ATCACCTTGA 


GGTCCACCGA 


TTACAAAGCG 


TCCTGTAGGA 


2040 


TTGATGTAGA 


ATTTAGTTTG 


TTCATTAATC 


AAGTTTTCTG 


GAACAGTTGG 


ATAAATGACA 


2100 






TGTCTTCTTG 


AATTTGTTCA 


AGTGTCACAT 


CCTCAGCATG 


TTGTGTTGAT 


2160 


15 




TATCAATACG 


TACTGGGTTA 


TCATTTTCAT 


CATATTCAAC 


AGTGACCTGA 


2220 




ACTTTAC CGT 


CTGGTCGTAA ATAATTTAAC 


GTACCATCTT 


TACGCACATC 


TGATAAACGT 


2280 




TTTGCCAATT 


GATGTGATAA ATAAATTGCT 


AGAGG CAT AT 


ACGTCTCTGT 


TTCATTCGTT 


2340 


20 


GUjIAACCAA 


ACATTAAACC 


TTGGTCACCT 


GCACCTGTTG 


CTTCAATTTC 


TTCTTCGCTA 


2400 




TCTTTATCAC 


GATACTCTAA 


TGCTTTATCC 


ACGCCTTGTG 


CAATGTCAGG 


TGATTGTTCA 


2460 




TCAATCGCAG 


TTAAAATTGC 


CATTGTTTCA 


TAATCATAAC 


CAT ATTTTG C 


TCTTGTGTAT 


2520 


25 


CCAATTTCTT 


TAATTGTTTC 


TCTAACAACT 


TTCGGAATAT 


CAACATATGT 


TGTTGTAGAA 


2580 




ATTTCG CCGG 


CGATCAATGC 


CATACCTGTT 


GTAACAGTTG 


TTtCACAAGC 


TACACGTGCA 


2640 




TTTGGATCGT 


CTTTTAAAAT 


AGCATCTAAT 


ATTGCATCTG 


ACACTTGGTC 


AGCGATTTTA 


2700 


30 




CTTCTGTAAC 


AGACTCTGAA 


GTAAATAATC 


GTTTGTTATT 


TAACATAGTT 


2760 






AATTTATATT 


ACGAAAATTC 


TCTCTCTGTG 


AGCTAAATAA 


AAAAGACCTT 


2820 


3$ 




ATATAGAGAG 


AAGGC CTAAT 


ACGTCCATTC 


GCTCTTATCG 


TTCAGACCTA 


2880 


~*l"l''IH."]['(.T i "|[X3f*A 


AAcGGTTTGG 


CACCTTTCTT 


TTATAAAAAA 


GAGGTTGCTG 


GGTTTCATTG 


2940 




GGTCCATGTC 


CCTCCACCAC 


TCAGGATAAG 


AGAATCCGTT 


AAAAATAATA 


GTACCTAATT 


3000 


40 


AATGAATTAA 


TGTCAATTTT 


TCACAAATAA 


ATTTACAGTA 


AAATATTGTA 


GATTAATTAT 


3060 




GTTAATGTGT 


TATACTAATT 


AAATGTAAAG 


GCTTACATTT 


AAATTATCGC 


TTTGGAGGGA 


3120 




TTTAGGATGT 


CAGTAGACAC 


ATACACTGAA 


ACAACTAAAA 


TTGACAAATT 


ACTGAAAAAA 


3180 


AS 


CCAACGTCAC 


ATTTTCAACT 


TTCGACGACA 


CAACTTTATA 


ATAAAATCTT 


AGACAATAAC 


3240 




GAAGGGGTAT 


TAACAGAACT 


TGGTGCTGTT 


AATGCAAGTA 


CTGGAAAATA 


TACTGGTCGT 


3300 




TCGCCTAAAG 


ACAAATTTTT 


TGTCTCTGAA 


CCTTCATATA 


GAGATAACAT 


TGATTGGGGA 


3360 


50 


GAAATTAATC 


AACCTATCGA 


TGAAGAAACT 


TTCTTGAAGT 


TATACCATAA 


AGTACTAGAC 


3420 




TATTTAGATA 


AAAAAGATGA 


ACTATACGTA 


TTTAAAgGcT 


ACGCTGGTAG 


CGATAAAGAT 


3480 
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ATGTTTATTA GACCTGAATC AAAAGAAGAA GCTACAAAGA TTAAACCTAA CTTCACTATC 3600 

GTTTCTGCAC CACATTTTAA AOCAGATCCA GAAGTTGATO OTACTAAATC TOAAACCTTT 3660 

GTCATTATTT CATTTAAACA CAAAGTCATT TTAATCGGCG GTACTGAATA CGCTGGTGAA 3720 

ATGAAAAAAG GTATCTTCTC TGTAATGAAT TATCTCTTAC CGATGCAAGA TATTATGAGC 3780 

ATGCATTGCT CAGCAAACGT TGGTGAAAAA GGCGATGTTG CATTATTCTT TGGTCTATCT 3840 

GGCACTGGTA AAACAACCTT ATCGGCTGAC CCACACOGTA AACTAATCGG TGATGATGAA 3900 

CACGGCTGGA ATAAAAACGG GGTCTTTAAT ATCGAAGGTG GCTGCTATGC AAAAGCAATT 3 960 

AATCTTTCCA AAGAAAAAGA ACCACAGATT TTTGACGCAA TCAAATATGG TGCAATTTTA 4020 

GAGAACACTG TAGTTGCAGA AGATGGTTCA GTGGACTTTG AAGACAATCG TTATACAGAA 4080 

AACACGCGTG CCGCTTATCC AATTAATCAC ATTGACAATA TTGTAGTACC ATCTAAAGCA 4140 

GCACATCCAA ATACAATTAT TTTCTTAACT GCGGATGCAT TTGGTGTTAT TCCACCGATT 4200 

TCAAAGTTAA ATAAAGACCA AGCAATGTAT CATTTCTTGA GTGGTTTCAC TTCTAAATTA 4260 

GCTGGTACAa GCGTGGTGTG ACAGAACCTG AACCATCATT CTCAACATGT TTCGGAGCAC 4320 

25 CGTTCTTCCC GTTACACCCT ACTGTTTACG CTGATCTATT AGGTGAACTT ATCGATTTAC 43 80 

ATGATGTTGA TGTTTATCTT GTTAATACTG GATGGACTGG CGGAAAATAT GGTGTAGGAC 4440 

GTAGAATCAG CTTACATTAC ACACGTCAAA TGGTAAACCA AGCGATTTCT GGCAAATTGA 4500 

AAAATGCAGA ATATACAAAA GATAGTACGT TTGGTTTAAG CATTCCTGTA GAAATTGAAG 4560 

ATGTACCGAA AACAATTTTA AATCCAATTA ATGCTTGGAG CGACAAAGAG AAATATAAAG 4620 

CACAAGCAGA AGATTTAATT CAACGTTTTG AAAAGAACTT CGAAAAATTT GGTGAAAAAG 4680 

TTGAACATAT TGCTGAAAAA GGTAGCTTCA ACAAATAAAT TTGAATACTA AATCaAAACC 4740 

ACC<5GTGTGA ACGGGTGGTT TGTTCTGCGG CTATAAGCCT TCCTTACTGG CCAGCCCTAA 4 800 

AAGGGCACTG ACAAGTCAGC CAACTGCACT ACTATTCCAG CAACCCTAAA GGGTTACTCT 4 860 

TTTTTCTTTC TTTTTTTATT TTTCTCTCCA GTGAAAGGAT CTAAATATTC TTCCATTGAG 4920 

ATTTGGTCTG CAACGATATC CTCTTGTAAT TGATTACGAA TATAATTTTC AATCACTTTT 4980 

45 TTATTTCTAC CTACTGTATC CACATAAAAT CCTTTACACC AAAACTTTCT ATTTCCATAT 5040 

CTATACTTTA AGTTAGCATG TCTATCAAAT ATCATTAAAC TACTTTTTCC TTTTAAATAG 5100 

CCAACAAATG ATGATACCCC AAGTTTGGGT GGTATACTAA CTAACATATG GATATGATCT 5160 

60 TTACATGCCT CTGCTTCAAT TATCTCTACA CCTTTTCTTT CACATAATTG ACGCAATATA 5220 

ATCCCTATAT CTTTTTTTAT TTTTCCATAT ATCACTTGTC TTCTGTATTT AGGTGCAAAG 5280 
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AAAT AG CATC TCCTCGTGTT GATTATTTTO GTTGGCTGAC CAATATTTAT TCTAGCACGT 54 00 

AGAGATGCAT TTTTTGTGAC AATGGTAGAA CCTTTTCtGa ACCATACGCA TAGCGTATGG 5460 

TTTTCTTTTT ACAATTAAAG AGCCAACCGT TGTTATAGTC TAACAATGGT TGGCTCCTCT 5520 

TATTTTATGT GCTAAAAATT TATAGGCAAT TTTATTACAA CAATGTACAT TTAAGGTGAC 5580 

CTTCATGCCA AAATCGCATC ACTCATTTAA TGGAAGCAGC ACGTCTTCAT ATAAAGTACC 5640 

GATCCCTAAT TCAACGCATG TAGTACCACA TCTTCAAAGC TTGATAGTTC CCATGCGCAC 5700 

ACCACGTTTC ATACTAGCTA TGCGACTCAA CTTGGTTCAT AAACTCTTTA ATATAAGTCA 5760 

ATGTTTCAAC CATCGCTGGT GGTCTTGGCA CATGTCCTTC TGCCATTTGA TAAAATGTTT 5820 

CATGCGTGGC ACCTTTTAAC TCTAGTTGGT CCGCTAAATA ATACGCATGA TGAATACCAA S880 

CTTGCTGGTC TTTCCCTCCA TGTACAATTA ATATTGGOGG ACTGTTTTCA TTAATGTTTG 5940 

2o GAATCGCTTG GCGTGCCTCA TATGCCGCTC GATCTTTTTT CGGATGACCA ATCATTCTTC 6000 

GTAGCATGCC TCTTAAATCG ACACGTTCTT CATACATTAA ATCAATATCT GAGACACCAC 6060 

CCCAGATTGT ATAACTTGTT ACTGGTAAGT CTTGAAATGT CAACAATCCT TGTAAACCAC 6120 

26 CTCGCGAAAA ACCAACCATG TGGATAAATG CATGTGGATA TTTATCATGT AGCAACCTTA 6180 

ATAATTG CG T CACATCATTT AAATCGCCAC GGTAAAATTC GTCTTTGCCT TCACTCCCAT 624 0 

TGTTACCTCG GTAGTATGGC CCAATCACTA AAGTTTGACT ATCTGAAAAT TGCATTAATC 63 00 

30 TACCTGCGCG CACACGTCCT ACTTGACCTT TGCCACCTCG CAAATAAACT ACAATGCGAT 6360 

TTACTTCATG ATGTGGTGTC AT CATT AAAG CTTTTACTTG TAAGTCATCT GACAAATATG 6420 

TAATTTCTTC GAATTGATGC GTAAAATATT CAATTGGCAT TCGTTTACGT TTGATAAAAC 64 8 0 

35 

CCAAGTGATT GCACCCTCTC TACGCATTTT AAAATGGTAC TATCTTGCAG TAAGAAACTC 654 0 

CGTTGTGCGA GTTCAATATC ATTGATACAG TTAAACAACA CTGGCCCTGC TGTTTCTAAA 6600 

TAATCGTTCT TGCTTACCAA TGATTCAACT TCGATAAAAT ATACATCTTT TACAAAATCA 6660 

40 

GTTTGATCAT GTGTTTCAAT GGTATATTGT GCTATGTAAT AAATATTTTT AACTTTGGCG 6720 

CCTGTTTCTT CATATAATTC aCGTGTAACT GCTTCAGCAC TACTTTCCCC GCGTTCCCTT 6780 

45 TTACCACCAG GAAATTCAAT CCCCCGTAAA TTATGTTTGG TAAAAAGCAA TTGATTTTTA 684 0 

AACGTTGGAA TAGCTAGCAC ATGATTGCCA TCTGCTATCT CATTATCCTT TTTAAATGTC 6900 

AAATTAACTT GACGATTATC TTTATCCCTA AACTTCACGC GCATCACATC CCTACATTGT 6960 

60 

ATGTTAATAT AATAGTTAAT TACTATCGTT GGAGG CATT A ATTATGAAAA AGATATTCTT 7020 

GGCGATGATT CATTTTTATC AACGTTTCAT TTCGCCACTC ACTCCACCAA CTTGTCGTTT 7080 
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CCTTTATTTA GGTATCCGTC GTATTTTAAA ATGTCATCCG CTTCATAAAG 


GCGGCTTTQA 


7200 




CCCTGTTCCG 


TTAAAAAAAG 


ACAAGTCAOC 


AAGCAAGCAT 


TCACATAAAC 


ATAACCATTA 


7260 


5 


ATATGGTTGT 


AATTGAGTTA TATCCACTAA AGGGGGGCGA AATTCGAGTC 


GCCCCTCTTT 


7320 




TAATATOCCT 


GAATGCGCCA 


CCACATCTTG 


TTCAAAATAA 


TAACCTGCTG 


GTGTAACATC 


7380 




TCCTCOATAA 


TCACCTTTAC 


GAGCAAGCAT 


CGCTGTAAAA 


TAGCGGCTTA 


AACCATATTC 


7440 


10 


GTACATCCCG 


CCAATAACCA 


CTTTTGCACC 


ATGACTTTTC AAAGTATCAA 


TTGCOGTTTG 


7500 




CACTTTATCA 


ATGCCACCTA 


GACGAAATGG 


TTTTAATACA 


ACAACTTTCA 


CATTGTATAA 


7560 


IS 


TTCTATCAAA 


TTAATTATGT 


CCaACAACGA 


TGTTGCCTTT 


TCATCAAGGG 


CTATTGGAGG 


7620 


TATTGTTCCA 


TCCGCTACTT 


CATCAAGCAT 


GGAGATATCT 


TTAAATGGCT 


CTTCGATATA 


7680 




AAGAACCTGT 


TCACGCGCTA 


ATAACTGTAA 


CTGTGTGAAA 


TCTTGACGAT 


CCAAGGACTC 


7740 


20 


ATTTGCATCT 


ATAACCAATT 


GAAAGTGAAA 


GTCTAATTCC 


CGTAACACTC 


TAATTTGATG 


7800 




CATGATTTGA 


GGCGTCCATT 


TTAATTTAAT 


TCTGGTCGGC 


TTTGTTGCTT 


TTAATGACTC 


7860 




TAGTTGTTTA 


TTTGATAAGC 


CGCTCGcTGT CGCTCCATAT 


GCTACTGAAA 


ATGAAGGCAG 


7920 


25 


TACATGAAAC 


ATTTGATACA 


ATGCCATGAC 


AATAGTTGCC 


CTTGCAGCAG 


GCGTATTTTC 


7980 




CAATGAATCT 


ACTAATTTTA 


GTGCTGCTTC 


ATACGTTTCA 


AATGATTTAT 


TT CTATTATC 


8O40 




TTCGAACCAT 


TGCTCAATTA 


CATGTTTCAC 


TGAGGCAATT 


GTTTCATGAT 


CATACCAATC 


8100 


30 


TGTTTGAAAA 


GCGTTACATT 


CCCCGAAATA 


TGCATTTCCT 


TTGTCATCAA 


TCAATTCGAT 


8160 




AAACAAACAA 


TCACGATGCG 


TTAAAGTGAC 


TTTCGGTGTT 


ACAATTTGTG 


ACTTAAATGG 


8220 


35 


CTCACTATAT 


TTATAAAAAT 


GCAAAGCTGT 


CAACTTCATC 


AAATCATCCT 


CTATACAACT 


8280 


TATTTCTTTG 


TAATTTACCT 


GTTGATGTAT 


AAGGTAAAGT 


ATCAACCTTT 


TCAAAGTGTT 


8340 




TCGGTACTTT ATATTTCGCT AAATGTTGTG ATAAATATGC 


AATCAATTGT 


GCCTTTGAAA 


8400 


AO 


TGTCACTTTC 


ACTGACAAAA 


TATAATTTAG 


GCACTTGGCC 


CCAAGTATCA 


TCAGGATGCC 


6460 




CTACACATAC 


TGCGTCACTG 


ATACCTGGAA ATTGctTCGC 


TACCGTTTCA 


ATTTGATATG 


8520 




GATAAATATT 


TTCACCGCCA 


CTAATAATTA 


AATCTTTACG 


TCGGTCATAA 


ATCATGACAT 


8580 


45 


AACCTTCATG 


ATCTATTTCA 


GCAATGTCAC 


CCGTATTAAA 


ATAACCATTT 




oo4U 




CCGTTAAATC 


TGTTGGATAC 


AAATATACAT 


TCATCACATT 


GGCGCCTTTA 


ATCATTAATT 


8700 




CTCCATGACC TTCTTTATTA GGAlTlTi'M TTTTTACGTC v AACATTGGCA 


CTTGGCATCC 


8760 


50 


CTACAGTGTC 


AGGACGTGCA 


TGCAACATTT 


CCGGTGTTGC 


TGTTAAAAAT 


TGCGAACATG 


8820 




TCTCAGTCAT 


ACCAAATGAA 


TTATAAATTG 


GCAGGTTATA 


TTGTAATGCC 


GTCTCTATCA 


8880 



55 



749 



EP0 786 519 A2 



10 



IS 



20 



25 



30 



35 



45 



60 



AACCTTGTTG CATAAGCCAA TTTAAAGTTT OTGGCACAAG 
CATTTTTAAT CATCGTTAAA ATTTGTTCGG CATTGAATTT 
AACCTTCAAT AACAGCTCTT AAAAGTACAC TGAGACCCGA 
CAGATAGCCA ATTAGTGTCA CGATCAAATC CCAAGCTCTC 
CATAATGATT ACGAAACGTT TGTGGCACCG CTTTTTGAGG 
ACATAATCGA TGCAATGTCA TCTAAATTAA ATGATGTATT 
CTTTCGGCAC CACAGTTTCA TTCGATGTTT CATATTGGAT 
AACTOTTCGT TGTAATATCC CTTCCAGCGA ATTCAATATC 
ACCCTCGTAA TTCCAGTGGC AAGGTACAAA AAATCAATTG 
GATTCGTCAT CTCATTAGGT GTCAACCTTG TATTAATCAT 
ACCAACATGC ATGTATTAAA ATGATCGATT GAATCGAATT 
GAGATTGTTG ATAAGCCTTG AGTCTTTTAG CCAATAGACT 
GATAAGTATA AGATTCTTGA CCGTCTGTTA TCGCAATATG 
GTTTATATAA CCAAAAGTCC ATGCGTTATT CCTCCAAAAT 
CGATTTTATG ACATTCTAGC AGTGGTTATG TTTAAAAATA 
TGCATTGATA TGATTGTTAT AATGCTCAAT ACATATCGTT 
TCAGTTATTT TTATTTAATT TTAGTGTCAT TCTGTCATTT 
TGTTGCCACA TCATCTGCAA TGTCAATTGG TATACGGTTC 
ATGGAATACT TCATCATCTA AATTTTCAAT GAGATATACA 
TTTATATTTT AACGTTTTCC AAAAGTCCGG CTTGCAATTC 
TTCAATAAAT AAGTAACGTT TGCTGCCTAC TTTGTCTATG 
TTCTATACCT CTTATATGTG CATAGTCTGC TGAAAAGTAA 
ATGTTGTTGT ATTTCAAATC GTTGGCCTAC TATTTTATTA 
(2) INFORMATION FOR SEQ ID NO: 144: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14 77 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 144: 



CGAAATGTGC 
ATCAACAATG 
AATATGATAA 
TTTACATCCG 
GCCCGTTGTC 
TAATATGTTG 
ACCCATTGTG 
ATCCAGCGAT 
TACATCGATT 
CGCAATTTCA 
ATCTATGTAT 
CGCTTCACAG 
ATGTCCATTT 
CATTTACATT 
TAAAAAAGTA 
ATATCATTCG 
TGATGTGGTG 
ATGTCTTGTA 
TAATATGTTA 
AATACATTAT 
AAATATTTTG 
ATACTACCTA 
TTTGTGCTAC 



GTGATTCGTT 
CGCACAGTAA 
ATCGGCAAGA 
ATTGCACTGG 
CCTGATGTAA 
GACGGCGACT 
TTGTCCAACA 
ACAATTTGAA 
GACTTCATCT 
ATATTTGCCA 
AGCCCAACAC 
TATAAATTTT 
TGTTGTGCTT 
ATAATTATAA 
GACGAATTGA 
TCTACTATTA 
ATTTACCCAT 
ATGCACTTAA 
CCTTGTCCTT 
CCGGAATATA 
CAGTGCCTTT 
TTGTTTCATT 
nGGGGACTTA 



9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
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GTGTGGATTG GATTTTAAAA TCACCCTCAT AAATACTGTC ATCAATATGA TAAGTTACAA 120 

TTTCACCTAT TATTAAATCA GCCCCATCTA ATACATCTCC AAGCAATATC ATTTGCGmTA 180 

GTTTACATTC GAATCTCATT TTCGCATCTT TAATTCCTGG CGTCTTAATC GTTGTAGATG 240 

TTAAAAGTGA TAATTCTGTA CGACTCAACT CACTGTCACC ATATGCTAAC GGCGCTGCAG 300 

TCTCATTAAT ATCTTGAACA TTATCTTCGT CTGTAATATG CACAACAAAG TCTCCAGTCC 3 60 

GTTCTATATT TAATGCAGTA TCTTTTCTCT TACCTCCTGC ACGTTOAACT GCAATAGCAA 420 

TCATTGGCGG ATGATTATTA ACAATATTAA AAAAGCTAAA TGGTGCTGCA TTTACTGATG 4 80 

CATCTTGATT TAATGTTGTA ACAAAAGCTA TAGGTCGTGG AATAATTGAA CCAATTAATA 540 

ATTTATAGTT TTCTCTAGCA GTTAATGATT GTGCATCAAA CGTATACATA ATACCTACCT 600 

CTTTTCTAAG TATATCTAGG TATTTCTCCG ATTTTGGTTA ATTTAAACAT CTATTCTCCT 660 

20 CTGAAAATCA CTTGTATTTA TTTAGCAAAT CTTTTGAAAT ATGACACATA TG CATATCTT 720 

CTGGATATTT TTCTAAATGT TGCTGATGTT CTTCAGCACT TTTAATGTAG TTAGACAGOG 780 

GTAAGACTTC CACTGCAATT TGATCTCTGT CTTTACGTCG TTCAATGAAC TGACGCGCTT 840 

CAATTAAGTG GTCATCTACA CAACTATATA AACCCGTTCG ATACTTTTGT CCAATATCAT 900 

TTCCTTGTTG ATTCACACTG TAAGGATCAA TGATTTCAAA TAAATAATTC ATAATGTCTG 960 

TAATTGTTAA CATACGATCA TCGAAATGAA GTTTGACACA TTCAGCATAA C CAT CATACG 1020 

GACCGTCTAA TTTAGAGCTT CTTCCATTTG CTCTTCCTGC TTCTGTATGT ATAATTCCAG 10 BO 

GTATTGTTGC AAAAAATGCT TCAACACCCC ATAAACATCC TCCTGCTACA TAAACAACTG 114 0 

CCATATTTAC ACCTCATCAT CCTTTTTTAT ATTTTTAACA AGGTTATACG ATTTAATACC 1200 

35 

GCCATGACAT GATTCTGATA CACCTTCATT ACGATACCCA TATTTTTCAT AAAATGAAAT 1260 

TAATGATTCT CGACATGTTA ACGTTACACC ATGTCGATGA TGATTCTTAG CAAGAGTTTC 1320 

40 AAAATAGTTT AGTAAG CGAC CTGCAATACC CTGACCTTGA TAATTTGGTG CTACAACAAG 13 80 

ACCTAACACA CTAATATAGC CACCTTCACT ATTATTTGTG GAGACATTTT TAAATAAATC 1440 

ATCGCTAATG TAACGCTCTT TTATGACTGG ACCGTTG 1477 

45 (2) INFORMATION FOR SEQ ID NO: 145: 

(i) SEQUENCE CHARACTERISTICS t 

(A) LENGTH: 3 976 base pairs 

(B) TYPE: nucleic acid 
so (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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AGGTGATTAT CCTAAAAATG CTCATGAGGT CGCTATTAAT GATAAOTTAG CTGCAGACAA 60 

CATTAGAGTC GGGGATAGAT TACATTTTAA AAATAATTCA ACTAGTTATA GAGTTTCTGG 120 

TATTTTAAAC GACACAATGT ATGCGCATAG TTCCATTGTG CTATTGAACG ATAACGGATT 180 

TAATGCATTG AATAAGGTTA ATACGGCATT TTATCCAGTG AAAAATTTAA CACAACAACA 24 0 

ACGTGATGAG CTTAATAAAA TAAATGACGT TCAAGTTGTG AGTGAAAAAG ATTTAACAGG 300 

TAATATTGCG AGTTATCAAG CAGAGCAAGC ACCGTTAAAT ATGATGATTG TTAGTTTGTT 360 

TGCTATTACA GCAATCGTTC TAAGTGCATT TTTCTATGTT ATGACGATTC AAAAAATATC 420 

ACAAATTGGC ATTTTGAAAG CAATTGGTAT TAAGACAAOA CATTTATTGA GTGCGTTAGT 480 

TTTACAAATT TTAACACTAA CAATAATTGG GGTAGGTATT GCTGTGATCA TCATAGTAGG 540 

ACTATCATTT ATGATGCCGG TAACGATGCC TTTTTACTTA ACAACGCAAA ATATTTTATT 600 

AATGGTGGGG ATATTTATAT TAGTAGCGAT TTTAGGTGCC TCACTATCAT TTATCAAATT 660 

ATTTAAAGTG GATCCTATCG AAGCAATTGG AGGTGCAGAA TAATGGCATT AGTCGTTGAA 720 

GATATCGTCA AAAATTTCGG AGAAGGTTTG TCTGAAACAA AAGTTTTAAA AGGTATTAAT 780 

25 TTTGAAGTGG AACAAGGGGA ATTTGTCATT TTAAATGGTG CCTCTGGTTC TGGGAAAACA 84 0 

ACATTGCTAA CGATATTAGG CGGATTGTTA AGTCAAACGA GTGGTACAGT GCTTTACAAT 900 

GATGCGCCAT TGTTTGATAA ACAGCATCGT CCTAGTGATT TACGATTGGA AGATATTGGT 960 

TTTATTTTTC AATCTTCACA TTTAGTTCCT TATTTAAAAG TGATAGAGCA ATTGACACTC 1020 

GTAGGTCAAG AAGCGGGAAT GACCAAACAA CAAAGTTCAA CAAGAGCAAT ACAACTTTTG 1080 

AAAAATATTG GTTTAGAAGA TCGCTTGAAT GTATATCCGC ATCAGTTATC TGGCGGTGAA 1140 

AAGGAACGTG TTGCGATTAT GAGAGCATTT ATGAATAATC CGAAAATCAT TTTAGCAGAT 1200 

GAGGCCACAG CAAGTTTAGA TGCCGATAGA GCAACAAAAG TTGTTGAGAT GATACGTCAA 1260 

CAAATTAAAG AACAACAAAT GATTGGTATT ATGATT A CAC ACGATCGAAG ATTATTTGAA 132 0 

40 

TATGCAGATC GAGTGATTGA ATTAGAAGAT GGCAAAATAA CTGATTAGTG GCTTGTAAAG 1380 

ACGCTAAATG TTAATGATTT AAGACATAGT AGTATAAAAG TTAGATAACA GAATACGATT 1440 

45 TGGGTTTACA AAAAACAGGC TGGGACATTA AGTTCTTAGG CAATGTAAAA AAGCTGATTT 150 0 

CTATTAATTA TTTGATAGAA ATCAGCTTTT TTGATATGTA TTTTATAATG TACAGCTCGT 1560 

TG CATT CAT A TAGCTTGAAG TCACGTTTAA AACCATATCT ATCATTATGG T ATG CAT ATC 1620 

60 TTTTAAAACC TATTCTTTTG TTATTAGGAC ATATAAATTC ATCATTAAGT TCGTCATATT 1680 

TCCAATTTTG AGTGTTAAAA ATGTCACTTT TAAACTTTCT AGTTTTATCT TTAATAAACA 174 0 
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CACTATCATA ACATGCATCA GCTACAATAT ACTCCGGTAA ATAACCGAAG nTATTTTgAA 1860 

TCATTGTTAA AAATGGAATT AAAGTTCTAG TATCTGTTGG GTTTTGAAAT AGGTCATAGG 1920 

ATAAAAGAAA TTGAGAATTT GTCGCTATTT GTAAATTGTA TCCTGGCTTA AGTTGGCCAA 1980 

AGTGTCTTAT TTTTTTAAAG TATTTAAAAG TAAAATTACA TGTTAATACG TAGTATTAAT 2040 

GGCGAGACTC CTGAGGGAGC AGTGCCAGTC GAAGaCAGGG GCCCCAACAC AGAArcTGAC 2100 

ATATAGTCAG CTTACAACAA TGTGCCGGTT GGGGTGGCTG AGACGGCACC CTAGGAAGGG 2160 

ACCCGTCATC AAAAATTCTA TTTATAGAAT TTTACAGTAA TGTGCCAGAT GGGCATAGCG 2220 

AAgcCATTCA ATAOGAAGTA TTGTATAAAT AGAGAACAGC AGTAAGATAT TTTCTAATTG 2280 

AAAATTATTT TACTGCTGTT TTTTTTAGGG ATTAATGTCC CAGACTCTTT AGTTTATTTA 2340 

TTTTCAATAT AACAATTGTC TAATCAAGGA TTAACGAATA TTTAAAGATA GTTTGACGCA 2400 

ATATTAGAAA CAACCTATAA TAATAGTTTG TTTGTGGATT AACTATTATA AATAAAAGCG 2460 

GCGTAAAGAC ATATAAACCA ACTACTTGAA CAATATAACG TTAATAACAA TCTATACTGA 2520 

TACATTACGC CTAGATAATC TTTGATGAGC ACATGTAAOA AAAAGTGATA TGGTGTATGA 2580 

25 CTTCCGACAC CATCGATAGA TAAACCTAAT TTTTGGGCTA GTCGTAAGGC GCGCAATACA 264 0 

TGAAACTGAC TTGTtACACA AACAATTTTA ACTGCTTCAT GATACAAATT GTTGATGATT 2700 

TGTTTAGAAT ATAAAAAGTT TGTGTATGTA TTTATAGAGT GAGATTCCAT TAGTATATCT 2760 

GTTTTATCAA CACCATGTGC AATCAAATAA CGTTGGATAG CTAAAGCTTC AGAAATTGGT 2820 

TCGTCTGGTC CTTGTCCGCC AGATACAATG ATCTTTGTTG CTGATGCTTG TTGTTGATAG 2880 

ATATCAAGTG CACGATCTAA ACGCGCTGCA AGCATTGGTG TGACAAATTC GGTAAAAATA 294 0 

CCAGCACCTA ACACAATTAT GATATCAACT TCTTTGTTGT ATGATCTATG TCTATATGAT 3000 

ACTOTCCAAA CGAGATAACA AATAAAGGTT AGTAACAGGG AAAGACATAA TATAGCTAAC 3060 

CACATAGACA AACCTTTCAC AATAGGTGAC TGAATCGTAC TTATAAATAG AAGTGCTGAT 3120 

GTGTAGAGTA CAAATTTATA TGAAAAAGAT AATAATTTTT TAATAAATAA GCGACTAGAA 3180 

GTATGAGAAA ATAAATATCT ATGTTTGAAT AGCATGATAA TACTGATTAT TATAAATGTT 3240 

4S ACAAACATAG ACCAAGGGAA AGTATAGGTC ATGATGCTAT AGATGAGTGA CAAAAATATC 3300 

GATATGACAA CTAAGATGTA GCATGTTAAA TTTAACGTCA GAGTATAGTT GAAAATTAAC 3360 

GGACAAATAA CGATAAGTAT AAATATTAAT AATAAATTCA ATAACATACT GACACCTCGC 3420 

50 TTATAATAAA TATTAAATAT AAATGTAGAT GATTTAATTT ATTAAAGCAA GGAGAAAGCA 3480 

GCAACATGTA AATCTTAATT TGTTATATTA TATATGGGTC AATATTTTTG TGTTTTTTAG 3 540 

55 



30 



35 



40 



753 



EP0 786 519 A2 



TATGGTAAAA CATTTACAAG ACCATATTCA ATTTTTAGAG CAGTTTATAA ATAACGTTAA 3660 
CGCATTAACT GCAAAAATGT TGAAAGATTT ACAAAATGAA TATGAAATTT CATTAGAGCA 3720 
6 GTCTAACGTA TTAGGTATGT TAAATAAAGA ACCTTTGACA ATTAGTGAAA TCACGCAAAG 3 7 BO 

ACAAGGTGTA AATAAGGCCG CAGTAAGCCO ACGAATTAAA AAGTTAATCG ATGCTTAATT 3840 
AGTTAAGTTA GATAAACCAA ATTTAAATAT TGATCAACGT TTGAAATTCA TAACCTTAAC 3 900 

10 

TGACAAAGGT Ag AG CAT ATT TGAAAGAACG TAATGCGATT ATGACAGATA TTGCGCAAGA 3960 
TATTACTAAT GATTTA 3976 
(2) INFORMATION FOR SEQ ID NO: 146: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 3346 base pairs 

(B) TYPE: nucleic acid 
<C) STRAND EDNESS : double 

2 0 <D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 146: 



25 


GCTACCTAGG 


CATTTAAGAG 


ATCAAAAAAT 


GTATGAATAT 


GAACGTTATT 


TTTATGAGCA 


60 




AGAACTTAAT 


GGCGTTGATG 


aAGGGGAAAT 


TTTAAAGAAG 


TTAAAAGACC 


CACAAGATGT 


120 




TGCAGCTGAA 


ACAAAAGCTA 


GAAGTGTTAT 


TGATTATGCT 


GAATCTAAAC 


CAACATTTGA 


180 


30 


AAATATTTCA 


AGAGCTGTTG 


CTGCTTCATT 


AAGTTTAGGC 


ATTCTATCTA 


TTTTTGTCAT 


240 




CCTTATACCA 


GTATCTATAG 


TTGGATTATT 


TGTATTAGCA 


TTATTTTTAA 


TATCACTTTT 


300 


35 


GCTGCTGTTT 


TGTCCAATTA 


TTTTATTAGC 


ATCAGCAATA 


TCCAGAGGAA 


TTGTGGACTC 


360 


, AATTAGTAAT 


GTATTTTTTG 


CCATATCATA 


TTCAGGATTA 


GGATTAGTAT 


TTATCATTGT 


420 




CATATTTAAG 


ATTTTAGAAT 


ACATTTATCG 


TTTAATCTTA 


AAATATTTAC 


TTTGGTATAT 


480 


40 


TAAAACTGTC 


AAAGGAAGCG 


TTAGAAAATG 


AAGAAATTCT 


TTTTTATTGG 


GCTUTTAGTG 


540 




TTTGTTGTCT 


TTTTTACAGC 


AGCAACCATT 


ATTTGGTTCA 


GCTATGATAA 


AAACAAATAT 


600 




GGTACTAAAC 


AATATGATAA 


AACATTCAAA 


gACGATGCTT 


TTGACAATGT 


ATCTATAAAT 


660 


45 


TTGGATAGTA 


CAGAACTTCG 


TATAAAACGG 


GGGAATCAAT 


TTAGAGTTAA 


ATATGATGGT 


720 




GACAATGATA 


TATTAATTAA 


TATAGTAGAT 


AAGACGTTGA 


AGATTAGTGA 


TAAAAGGTCT 


780 




AAGACAAGAG 


GATATGCAAT 


TGATATGAAT 


CCTTTTCATG 


AGAATAAGAA 


AACGTTAACG 


840 


60 


ATTGAAATGC 


CTGATAAAAT 


GATTAAACGT 


TTAAATCTAT 


CATCTGGAGC 


AGGAAGTGTT 


900 




AGAATCAGTG 


ATGTTGATTT 


AGAGAACACA 


AGTATTCAAA 


GCATTAACGG 


TGAAGTAGTT 


960 
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AGTAAAAGTA 


ACATTAAAAA 


TAGCAATATT 


AAAGTTGTTA 


TTGGTACGCT 


ACAAATCGAC 


1080 




AAGAGTCAAA 


TTAAACAATC 


CATATTTTTA 


AACGATCATG 


GTGACATTGA 


ATTTAAAAAC 


1140 


5 


ATGCCATCAA AAGTAGATGC 


AAAAGCTTCT 


ACTAAACAAG 


GAGATATTCG 


TTTTAAGTAT 


1200 




GATAGTAAAC 


CTGAAGACAC 


TATACTAAAG 


CTAAATCCGG 


GAACGGGTGA 


TAGCGTAGTT 


1260 


10 


AAAAATAAAA 


CATTTACTAA 


TGGtAAAGTT 


GGGAAAAGCG 


ACAATGTTTT 


AGAATTTTAT 


1320 


ACGATTGATG 


GTAATATCAA AGTTGAATAA ATAAAGGATG 


TAAGCACCGA 


TATTAGGAAG 


1380 




CATAATTTCT 


CTAATATCGG 


TGTTATTTAT 


TTGTTGGCAA 


AAGTTAAGTC 


GGTATCTATA 


1440 


15 


TTGCCAGTAA 


AGTGAGTGAT 


ATTAAGGTCT 


TGACCATCTA 


ACCATGATTT 


G Aft A TOT ATT 


1500 




ATTTCTGGTG 


GCGCATTTTC 


TCCCAATGTA AAATATGCAG 


TTAATGTTTC! 

X Xrara X %J X X X \* 


AGGTTGATAC 


X 9 v w 




ATTGATGTAT 


GGATGGTGCC 


AGACCAGCTT 


TTCAJVT*Af3TT 

X -A VJIW JL ^XV7 A A. 


TACTTGTAAAT 


TTCATAfTIV5A 




20 


GGATTATTGA ATAACTTAAA 


TGCTGTAGTC 

X X %J X«»\J X W 


ATATCTAAAT 


TATCATTAGT 


TTGTGAAATG 


icon 
1DOU 




GTACGCGCCA 


GTCTTTCTTT 


AGATTCTTTT 

* nil »X oVV^X X X X 


GTATAATTAC 

^^XX^Xs^^&X Am^\m 


GATTTTCATG 


TGTTAATATT 






TCAAAATGAT 


TTGTACATAT 


ATTATCATAA 


CGAACATCTA 


TTGATCTCGG 


TGTCACTTCA 


1 Q A A 


25 


ACAATTGCAT 


GGTTCAATGA 


TTTGTCCATC 


AGTATGTAGC 


TAAATGAGCT 


TCTGTGTGGT 


XobU 




ATTTCTTTCA 


ATAATTGGAT 


TGCTTCTGTT 


ACATTTCGGC 


AATTTTCAAG AATTAGACGA 


"i a *5 a 




CCAATCATAT 


AACATACAAA 


ACCATTTGCT 


GGTTTCTTCC 


GGTGCATAAA 


GTTATAGCCC 


1 Q O A 


30 


ATAGTTAATC 


CTGACTCATT 


CATACCATCC 


ATTCTTCCAG 


TTACCCTTGA 


TACAGGACCA 


O A A A 




ATTTGAGCTA 


AACCGCTATC 


TGTAGGTTGA 


TAAAGTAAGT 


AGOGACCATC 


ATAAGTTGCA 


Ol Art 


35 


GGGTGGTAAT 


CATAATTTCT 


AACCATGAAG 


TCTTTGCCTT 


GAAAGACCGT 


GCAaCCACTT 


x, D U 


TCTTTTAAAT 


CGGTAAAACG 


ATAATGTCCA 


AAGTTTAAAA 


TAATTTGGCG 


TGTTGGCATT 






TTGAGTATAC 


TTTGTAGTCC 


CATTAATTCT 


TCCCATATTT 


GAGGTGCGTA 


TGTTTGGAAT 


2280 


40 


ATTTGATAAG 


TTTCATTTAC 


ATCTATATCG 


AAACGTGGGA 


CaCnTTTTTT 


CCATTCTTTT 


2340 




TCTCGATTTT 


TTAGAAGAGG 


TGTTTGTTGA 


AGCCATTTAC 


CAOTTTTAAC 


ACCTAACTCG 


2400 




AAATGTGAAC 


CTCTAAAAGT 


CATGATATCT 


GATGTCACTT 


GTTGCATATC 


ATCGGCCCCT 


2460 


45 


TTCTTTTTAG 


TTGTAATATA 


TTGTAAATAA 


ATAGTAATCG 


TATGTATATT 


GAATGTCATG 


2520 




TTAAATAAAG 


TTATATTTTA 


CTAAATGAAA 


TATAAAATTG 


TTTGAGGTGA 


TTTCTCGGTG 


2580 




TATAAGACTT 


ATCAATCAGT 


TAAAACATAT 


TTTTATAGAT 


GGTGGGGATA 


TTGAGTTAAA 


2640 


50 


AACTTAAAAT 


CATCTTATCA 


TAAATATCAA 


TCTTAAGTTA 


GCATTCACGA 


TAATAGTCAT 


2700 




TGTTAACATT 


AGCATATAAG 


GTCATGTCAC 


GTTGAAACAG 


AGGTTCCTCG 


GCATTTTTGA 


2760 
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TTATTTAATG ATTATTCTAT ATATGATAGT ATAATGAAAT GTAGATAGGT ATTTAATTTA 2880 

ACAGAGGTGA AATTGAGATG TGGAATTTTA TTAAATGtGT GkTTAAATTC GTATTTAGCT 2940 

5 TAGTTGCTAT TACAACATTA GTTGCTGGTG TTGGTGTAGT AGCATTTGCT TATATCTTTA 3000 

AAAAAGATTT TGAAGATATT GAAAGAAAAA CTAAAGAAAT TATTTCTGAT ATTGAAAGTA 3060 

AAAATAACTA ATAACATTTA GAGGCTGGGA CATAAATCCC TAAAAAACAG CAGTAAGATA 3120 

10 A TT T T CAATT AGAAAATATC TTACTGCTGT TCTCTATTTn ATcAmTACTt CGTATTGAAT 3180 

GGCTTCGCTT TCCTAGGGTG CCGTCTCAGC CTTGGTCTTC GACTGGCACT GCTCCCTCAG 3240 

GAGTCTCGCC ATTAATACTA CGTATTAACA TGTAATTTTA CTTTGGAAAT ACTTTTAAAA 3300 

15 

AATAAGACAC TTTGGCCCAA CTTGGCACAT AAATGTAAAA TTCAAT 3346 
(2) INFORMATION FOR SEQ ID NO: 147: 

20 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 2375 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14 7: 





GTTGAAGAAA 


GAAATATAAC 


AGTCAATTAT 


AATTATAACC 


TTGTTGAAAT 


CGACGGTGAC 


60 


30 


AAAAAAGTGG 


CTACATTCGA 


ACATATCAAA 


GCATACGATA 


GAAAAACAAT 


AAGTTATGAT 


120 




ATGTTACATG 


TAACACCACC 


TATGGGTCCC 


TTAGATGTAG 


TAAAAGAAAG 


TACACTTTCA 


180 


35 


GATAGTGAGG 


GTTGGGTAGA 


TGTTAACCCA 


ACCACATTAC 


AGCATAAAAG 


CTACTCTAAT 


240 


GTATTTGCAC 


TTGGTGATGC 


TTCAAATGTA 


CCTACTTCAA 


AAACAGGCGC 


ACTATTc GTA 


300 




AGCAAGCACC 


TATCGTCGCT 


AATAATTTAT 


TGCAAGTGAT 


GAATAATCAA 


ATGTTAACGC 


360 


40 


ATCATTATGA 


TGGTTATACT 


TCATGCCCTA 


TTGTTACTGG 


ATATAATAGG 


TTAATACTTG 


420 




CAGAGTTTGA 


TTATAATAAA 


AATACTAAAG 


AAACAATGCC 


GTTTAATCAG 


GCCAAAGAAC 


480 




GTaGAAGTAT 


GTATATATTT 


AAGAAAGATT 


TATTACCTAA 


AATGTATTGG 


TACGGCATGC 


540 


45 


TAAAAGGATT 


AATATAATAA 


AGTACAGAAA 


ACAATAAATT 


TTTAATGAAA 


AATCTTTTAC 


600 




TATAAAAGAT 


TAAGTATTTA 


AATGACGTGT 


CAGTGTTGTG 


TTTATATGTC 


GTGAArrrrr 


660 




AGCTCTAAAT 


AGTATAAGAT 


TGAAAAAGTT 


GTTACTGTTT 


TAAATGATCA 


CGATGAAGTC 


720 


SO 


ATTCAATAAG 


AATGATTATG 


AAAATAGAAA 


CAGCAGTAAG 


ATATTTTCTA 


ATTGAAAATC 


780 




ATCTCACTGC 


TGTTTTTTAA 


AGGTTTATAC 


CTCATCCTCT 


AAATTATTTA 


AAAATAATTA 


840 
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5 



10 



15 



30 



35 



40 



AGATATTCAA 


ACCACGTGTA 


CTCAAAATGA 


TAGCTTGGTA 


TGTACCTCCA 


ATAGTAATTT 


960 


CAATAACTTT 


GTCTGTTGAA 


CACTAAGAGC 


AATTTTAATT 


TCATAATGTG 


TTGTAAACAT 


1020 


TTTTTTTGAT 


TGGAOTTTTT 


TTCTGAGTTA 


AACGATATCC 


TGATGTATTT 


TTAATTTTGC 


X080 


ACCATTTCCA 


AAAGGATAAG 


TGACATAAGT 


AAAAAGGCAT 


CATCGGGAGT 


TATCCTATCA 


1140 


GGAAAACCAA 


GATAATACCT 


AAGT AG AAAG 


TGTTCAATCC 


GTGTTAAATT 


GGGAAATATC 


1200 


ATC CAT AAA C" 


TTTATT1V PTP 
x X X^^X Xn%»xv« 


ATACTATAAT 


T f* A ATT^FT 2VJV 
X l^WftX x x xn/\ 


CGTCTTCQTC 


^p^^ XXX WWv X 


1260 








Vjl^nAX lUnl X 


^ ^ y y* fv 'i* i —i *^ w. *y 
Ululvil x w% A 


Uin X lUHi Vj X 


i ton 


Umvviji x witi* 


XAljrlAy\»C X W X 


X A X\?V*V*A^*l9^. 


AUAX AVjAX X X 


T212121f221 ZVTfT 
lAAnVMlAlv X 


AV^Vs V-xiAXTv. X\- 


xJOU 


X xvaAnX wlv- 


vlAI X iVJiAiV. 


TTTyTCATAT 


TTGXTAAACA 


2iTY2 TXT 2i 21TY? 
a XVjurt X Ax AX \j 


UUilUlvJiAy 


1 Ail ft 




GTTCyTTGCT 


TGTGTGTTCG 


CGTGGTTCTT 


TTTCAAAAGT 


VxAAXv^vicAl X\j 


13UU 


TGGAAAATOC 


CTCTACCAAT 


CATGATG C CA 


rp/~»ft ft TA^PXT 

TCaATACCaT 


ATTTTTCTGC 


ft ft / »'I>»H/^ft » firri 

AAUM iCAAGT 


1560 


C x~±~x~l~X'C 


TATCGGGAAT 


ft rrt/^ ft ft\/*>/ KIKW ft 

ATCATCGTTA 


ATTGTTAACA 


ATGTGTTTGG 


TGCAAl 1 ICG 


1620 


TCACGTAAAT 


TTTTAATAGC 


TTCGATTAAT 


TCCCAATGTG 


CATCTACTTT 


ACTCATGCGT 


1680 


miM ft fV>ft ft a ft & 

TTGATAAAAA 


^wwwi ft • ft mft ft #»» 

CTTAAATAAT 


ATTAATTCGG 


TCATCAGTGG 


/VW|*PH ft T.TOT 

CGTTAAATCT 


TTTATCATTT 


1740 


TTAGTTATAG 


TTGATAAATT 


TATATTTATA 


AGCATATATG 


GATATTTCAT 


CaaAaATTTT 


1800 


TATTTATATA 


AATCCGAACT 


G CATACATAT 


TTGTTTAAAT 


AAGAGGTATT 


ATTTTTCGGG 


1860 


ft. ft ft llttl/IOIIV'IIW 

AAATTGCTGT 


/•vnn ft / »M Wf > -It ft ft 

CTGAGTTAAA 


AGGATT AG TT 


1 1 Ml Ift fT*ft ft ft ft ITV^ 

TTATAAAATG 


ft W| V*l ft TV / WII ft 

AGTTCSAACTA 


TAGCCAAAAA 


1920 


7* H»|i» ft ft ft rr? 

CGATTAAAAT 


7» fwrV* ft #p ft ft rr»/-» 

ACTGATAATC 


CATTTTTGtA 


TTATGTTAGG 


GACTTTTTTA 


CTTAATTTTA 


1980 


ACCCTATTGG 


duunAAiAlA 


ft ♦T'TV PTPr'PT 7A 

1LLL1A 


r P r Pfv r PTk flO/lR 7\ 
X iAliuvjuAA 


lAAviv^ulUA 


lAlAAawWi 


O ft A. ft 


TATAACCTTG 


AAiAAurl llu 


A X \iAUAAAA\J 


VALLAAl l\iA 


nVwilAlivvui 


Uwwii InLln 


'^1 Aft 


TACrfATTAGC 


GACTACAGTA 


TTCATTGGTA 


ATTTGAATAA 


AACCAATAAT 


ATAGGAATAA 


2160 


TAATGAAGGC 


ACCACCTGCA 


CCTACTATAC 


CTGAAATAAT 


ACCAATGAAA 


AGGCCAATGA 


2220 


TAACTAATAA 


ATATTTATTA 


AATGAAGACT 


TTTCGGAACT 


AGGTTt CACT 


TTAATAAACA 


2280 


TTAATGTTAA 


TGCAAGTAAA 


GCAATAATGA 


TATATACCGT 


ATTTACAAAT 


GTAGCATCAA 


2340 


ATAAATTTGC 


TAGAAATGCA 


CCTAACATAC 


TCCCT 






2375 



<2) INFORMATION FOR SEQ ID NO: 148: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 6115 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION: 


SEQ ID NO: 


148: 








GAGGTTTCTA GACAAGCTTT TAATAACTTA CCAAACTCAT TAAgrTGGTT gTGtTGGACT 


oU 


5 


GCCtATTATC mAAGtATTAT 


GaGTTGTTTA 


ATATTAGtGC 


TAArACATAC 


GAAGAGTGGT 


1 O A 

120 




TTAAACAATT TAGTAGTAAG 


AAAGCACAAT 


TCAGTATTAA 


TCTCACGGAT 


AAATGGATAA 


180 


10 


TTCAAATCGC ATATGGTAAA 


TTAATAATAA 


TGGCTAAAAA 


TAATGGCGAT 


ACATATTTTA 


240 


GAGTTCAAAC AATTAAAAAG 


CCAGGTAATT 


ATATTTTTAA 


CAAATATCGA 


TTAGAGATAC 


300 




ATTCTAATTT ACCAAAATGT 


TTATTTCCGC 


TTACAGTGAG 


AACACGACAA 


ARTGGCGATA 


360 


1S 


CATTTAAACT GAATGGGCGC 


GATGGTTATA 


AGAAAGTGAA 


lUul>UlUi X X 


ATAG ATTGT A 


420 




AAGTGCCACA GTGGGTTCGG 


GATCAAATGC 


CAATCGTATT 

win a wxni x 


GGATAAACAA 


PAfZPnPATTA 


480 




TTGCGGTAGG AGATTTATAT 


CAACAACAAA 


PAATAAAAAA 


ATGGATTAVA 


ATTAflfA AAA 


540 


20 


ATGGAGATGA AT AG CGTTAT 


Gf^ATAATfSAT 


TTGA A AGA Af*2 




TY2A ftrt & TV /""•'AT* 

x\sAAu AAVs A 1 


600 




ATTCAAAATA TCTGTAAGGA 




OAATTAAPA A 


Af2fJATTATPA 


AWjTAAACCA 


660 




TTAGTATGPG TYWITZ^TPTT 
x x x -n. x vj \ j IVJUUXnlvl 1 


A IV & Unrt/TY* A 


GCAATGTTTA 


TGTCAGATXT 


AATTAAACGA 


720 


25 


ATTGATACCC ATTTAT PAAT 


TV*^ R 1 1 '*l m '1 VI 
X XXX \-~r\ X lj 


unlul llLln 


\ax x *\ x\~t\K.\j\j 


AGGCACTGAG 


780 




TCAACTGGTG AAfiTTrRAAT 

x v«rw\_ A uw x vj nr\\7 X X V*r\rl/\ x 


PA TT A A Af^l 2k T 


'I'M' f^i i* !"IV "1*1' 


IX 1 IVjAAAA 


TAAAGACGTA 


840 




TTAATTATTG AAGATATfTT 


AG AH A nY^GT 


APTAPAPTTA 


RHTr A A TT A p 


TGAATTATTA 


900 


30 


CAATGTAGAA AAGTTAATTC 


ATTAGAAATA 


V7 X X All* XXX t\ X 


TAG AT A A APP 




960 




AAAGCGGACA TTGAAGCTAA 


GTATGTAGGT 


AAAAAAATAC 


CAGATGaATT 


X V7 X lOl X VJ^sj <_ 


1020 


35 


TACGGTTTAG ATTATCGTGA 


ATTAT AC CGA 


AACTTACCAT 


ATATCGGTAC 


GTTAAAAPfT 


1080 


GAAGTGTATT CAAATTAATT 


TTTTAATCAA 


TTTCAGTTAT 


TATTACTATG 


CGTTTGAGAA 
v<w xxx unuftn 


1140 




ATAATAGTGT AGACTCAAAA 


ATATGAAAAA 


TGTATTTCAT 


ATATATTTAA 


TTTTAGACAA 


1200 


40 


GACATATGTC TTGAAAAGTT 


GAAAAATATA 


GAGATTGATA 


AAACTAATAC 


GGGTGTGAAT 


1260 




UAUii IviAIt* 1 I AAGLTCAA 


TTACTAGCTT 


ATAAAACATG 


TCATATGTTA 


CAATTTTTGT 


1320 




TAGTTTTATT ATGGGAAGTA 


GGAGGAAATG 


ACGCATGCAG 


AAAGCTTTTC 


GCAATGTGCT 


1380 


45 


AGTTATCGTA ATAATAGGCG 


TTATTATTTT 


TGGTCTATTT 


TCATATTTAA 


ACGGTAATGG 


1440 




AAATATGCCG AAACAGCTTA 


CATATAATCA 


ATTTACTGAG 


AAGTTGGAAA 


AAGGTGACCT 


1500 




TAAAACTTTA GAAATCCAAC 


CACAACAAAA 


TGTCTATATG 


GTAAGTGGTA 


AAACGAAAAA 


1560 


50 


TGATGAAGAC TATTCATCAA 


CTATTTTATA 


TAACAACGAA 


AAAGAATTAC 


AAAAAATTAC 


1620 




TGATGCTGCT AAAAAGCAAA 


ACGGTGTAAA 


ATTAACGATT 


AAAGAAGAAG 


AAAAACAAAG 


1680 



55 



758 



EP0 786 519 A2 



TTTCTTCCTA AGCCAAGCAC AAGGTGGOGG TAGTGGCGGT CGTATGATGA ACTTTGGTAA 1800 

AT CTAAAGCA AAAATGTACG ATAATAATAA ACGTCGTGTT CGTTTCTCTG ATGTAGCAGG 1860 

5 GGCAGATGAA GAAAAACAAG AATTAATTGA AATTGTTGAT TTCTTGAAAG ATAATAAAAA 1920 

ATTCAAAGAA ATGGGATCTA GGATTCCTAA AGGTGTCTTA CTTGTTGGAC CTCCAGGTAC 1980 

TGGTAAAACA TTACTTGCTA GAGCGGTTGC AGGTGAAGCT GGCGCACCAT TCTTCTCTAT 2040 

10 

TAGTGGTTCA GACTTTGTAG AGATGTTTGT TGGTGTTGGT GCGAGCCGTG TTCGTGACTT 2100 

ATTCGATAAT GCTAAGAAAA ACGCGCCTTG TATCATCTTT ATCGATGAGA TTGATGCTGT 2160 

TGGTCGTCAA CGTGGTGCAG GTGTTGGTGG CGGTCATGAT GAACGTGAAC AAACCCTAAA 2220 

CCAATTATTA GTTGAAATGG ATGGTTTCGG TGAAAATGAA GGTATCATTA TGATAGCTGC 2280 

TACAAACCGT CCTGATATCC TTGACCCAGC CTTATTACGT CCAGGTCGTT TTGATAGACA 2340 

2o AATTCAAGTT GGTCGTCCAG ATGTGAAAGG CCGTGAAGCA ATTCTTCATG TTCATGCTAA 2400 

AAACAAACCA CTTGATGAAA CGGTTGATTT AAAAGCAATT TCACAACGTA CACCTGGTTT 2460 

CTCAGGTGCT GATTTAGAGA ACTTATTAAA TGAAGCATCT TTAATTGCTG TACGTGAAGG 2520 

TAAAAAGAAA ATTGACATGA GAGATATCGA AGAGGCAACG GATAGAGTTA TAGCCGGACC 2580 

TGCTAAGAAA TCTCGAGTTA TTTCTAAGAA AGAACGTAAT ATTGTTGCTC ATCACGAAGC 264 0 

TGGTCATACA ATTATCGGTA TGGTACTTGA TGAGGCAGAA GTAGTGCATA AAGTTACTAT 2700 

30 TGTTCCACGT GGACAAGCAG GTGGTTATGC AATGATGCTA CCTAAACAAG ATCGTTTCTT 2760 

AATGACTGAA CAAGAGTTAT TAGATAAAAT CTGTGGTTTA CTTGGTGGAC GTGTATCAGA 2820 

AGATATTAAC TTTAACGAAG TATCAACAGG TGCTTCAAAT GACTTCGAAC GTGCAACACA 2880 

35 

AATCGCACGC TCAATGGTTA CGGAATATGG TATGAGTAAA AAATTAGGAC CATTAGAGTT 2940 

CGGTCATAGC AATGGTCAAG TATTCTTAGG TAAAGATATG CAAGGTGAGC CTAATTATTC 3000 

AAGCCAAATC GCATATGAAA TTGATAAAGA AGTTCAACGA ATCGTTAAAG AACAATACGA 3060 

40 

ACGTTGTAAA CAAATTTTAT TAGAGCACAA AGAACAATTA ATTTTAATTG CTGAAACATT 3120 

ATTAACAGAA GAAACATTAG TTGCTGAACA AATTCAATCA TTATTCTACG AAGGTAAATT 3180 

45 ACCTGAAATT GATTATGATG CAGCTAAAGT TGTTAAAGAT GAAGATTCTG AATTTAATGA 3240 

TGGTAAATTC GGTAAATCTT ATGAAGAGAT TCGTAAAGAG CAATTAGAAG ATGGACAACG 3300 

TGACGAAAGT GAAGATCGTA AAGAAGAAAA AGATATTGCT GAGGATAAAA AAGAAGCTGA 3360 

60 TAAATCTGAT GAAAAAGATG AACCAGCACA TCGACAAGCC CCAAATATCG AAAAACCTTA 3420 

CGATCCAAAT CACCCAGACA ATAAATAATC GATTATATTC AGTACCTCTT TCTATGATAA 3480 
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AATTGTTATA 


GCAGAAAATA 


ATTGTAAAAC 


AAGTTACTTC 


ATTATTTAGA 


ATGATGGGTG 


3600 




TAGAATAAGT 


ACAATTGTTG 


CATTTTATGA 


AGTAAAGTAA 


TTTTTTAAAT 


ATAGAGTAAT 


3660 


5 


AGAGOAGATT 


GAAATAATGA 


CACACGATTA 


TATTGTTAAA 


GCATTAGCAT 


TTGATGGAGA 


3720 




GATTAGGGCT 


TATQCTGCTT 


TGACAACTGA 


AACTGTTCAA 


GAAGCACAAA 


CGAGACATTA 


3780 




TACATGGCCG 


ACAGCATCTG 


CTGCAATGGG 


AAGAACAATG 


caCAGCAACA 


GCTATGATGG 


3840 


10 


GCGCAATGTT 


GAAAGGTGAT 


CAAAAATTAA 


CTGTCACTGT 


AGATGGCCAA 


GGACCTATTG 


3900 




GACGAATTAT 


TGCCGATGCA 


AATGCTAAAG 


GCGAGGTGCG 


TGCTTATGTA 


GACCATCCAC 


3960 


15 


AAACTCATTT 


TCCATTAAAT 


GAGCAAGGTA 


AACTTGATGT 


AAGACGAGCG 


GTAGGGACAA 


4020 


ATGGATCTAT 


TATGGTTGTT 


AAAGACGTTG 


GAATGAAAGA 


CTATTTCtCT 


GGAGCAAGTC 


4080 




CaATTGTTTC 


AGGAGAACTT 


GGTGAAGATT 


TTACTTATTA 


TTATGCTACA 


AGTGAACAAA 


4140 


20 


CACCTTCATC 


GGTAGGTCTT 


GGTGTATTGG 


TAAATCCTGA 


TAATACGATT 


AAAG CAGCAG 


4200 




OAGGATTTAT 


CATTCAAGTT 


ATGCCAGGTG 


CCAAAGATGA 


AACAATTTCA 


AAATTAGAAA 


4260 




AAGCAATTAG 


TGAAATGACA 


CCAGTTTCTA 


AATTAATTGA 


ACAAGGATTA 


ACGCCAGAAG 


4320 


25 


GATTACTAAA 


CGAAATCTTA 


GGTGAAGACC 


ATGTGCAAAT 


TTTAGAGAAA 


ATGCCTGTTC 


4380 




AATTTGAATG 


TAATTGTAGT 


CATGAGAAAT 


TTTTAAATGC 


TATTAAAGGA 


TTGGGCGAGG 


4440 




CTGAGATTCA 


AAATATGATT 


AAAGAAGATC 


ATGGTGCTGA 


AGCAGTATGT 


CATTTCTGTG 


4500 


30 


GAAATAAATA 


TAAATATACT 


GAAGAAGAAT 


TAAACGTGTT 


GCTAGAAAGT 


TTAGCGTAAT 


4560 




TTAATTTAAA 


TCAATACGCT 


AAAATGTTTA 


TTTTTAGCGG 


TTTAGTGAAA 


TGTAGAACTA 


4620 


35 


AATAGTTGTA 


TAATCCTTAG 


TGATTTTGTT 


TGCTTTCTAG 


AATTTATTTG 


ATAAAATAAT 


4680 


TCTATATGCG 


ATAAATAAAC 


TAAGATTTCA 


ACAACTAACT 


AAAAAGGAGT 


GTTCTTAATG 


4740 




GCA<2AAAAAC 


CAGTAGATAA 


TATTACTCAA 


ATTATTGGCG 


GTACACCGGT 


AGTCAAATTG 


4800 


40 


AGAAATGTAG 


TAGATGACAA 


TGCAGCAGAT 


GTTTATGTAA 


AATTGGAATA 


TCAAAATCCA 


4860 




GGTGGTTCTG 


TAAAGGATAG 


AATTGCTTTA 


GCAATGATTG 


AAAAAGCAGA 


GCGAGAAGGC 


4920 




AAAATTAAAC 


CTGGCGATAC 


AATTGTAGAA 


CCAACAAGTG 


GTAATACAGG 


TATCGGTTTA 


4980 


45 


GCATTTGTAT 


GTGCTGCTAA 


AGGATATAAA 


GCAGTATTTA 


CTATGCCCGA 


AACAATGAGC 


5040 




CAAGAGCGTC 


GTAATTTATT 


AAAAGCATAC 


GGTGCGGAAT 


TAGTTTTAAC 


GCCTGGATCA 


5100 




GAAGCGATGA 


AAGGTGCAAT 


TAAAAAAGCT AAAGAATTGA AAGAAGAACA TGGTTACTTC 


5160 


60 


GAGCCACAAC 


AATTTGAAAA 


CCCTGCGAAC 


CCTGAAGTTC 


ATGAGTTAAC 


TACAGGTCCT 


5220 




GAGTTATTAC 


AACAATTTGA 


AGGGAAAACT 


ATCGATGCGT 


TCCTAGCTGG 


TGTTGGTACT 


5280 
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GTTGCEATAG AGCCTGAGGC TTCTCCAGTA TTGAGCGOTG GTGAGCCAGG TCCACATAAA 5400 

TTACAAGGTT TAGGTGCTGG ATTTATTCCA GGCACTTTGA ATACAGAAAT CTATGACAGT 5460 

5 ATTATTAAAG TAGGAAATGA TACAGCGATG GAAATGTCTC GTCGAGTTGC TAAAGAGGAA .5520 

GGTATTTTAG CAGGTATTTC ATCAGGTGCT GCGATTTATG CTGCCATTCA AAAAGCAAAA 5580 

GAATTAGGAA AAGGTAAAAC AGTAGTAACA GTATTGCCGA GTAATGGTGA ACGCTACTTA 5640 

10 

TCAACACCTT TATATTCATT CGATGACTAA TTAATGTCAT TTAAAAGAGT GAGTTATCTT 5700 

TTTGAGATAA CTTGCTCTTT TTTTCTACCA TGTATATTTT TAAAAATATG AGCGTTAAAT 5760 

15 TAAACATTTT TCTGATAAAA ATATCCAGTG AATGATAAGA TAATAAACGT ACATACTAAT 5820 

AACTAGTAAA TAGCAGGAGT AAATTTTATT AGAGTTAAAC AATACATAAT TAAAGGGTGG 5880 

TTAACATGAC TAAAACAAAA ATTATGGGcA TATTAAACGT CACACCIGAT TcATTCTcAG 5940 

20 ATGGTGGAAA ATTTAATAAT GTTGAATCAG CTATAAATAG aGTGAAAGCC ATGATAGATO 6000 

AAGGTGCTGA CATTATAGAT GTTGGAGGTG TTTCAACGAG ACCCGGTCAT GAAATGGTTT 6060 

CATTAGAAGA TGAGATGAAC AGAGTATTAC CTGTTGTTGA AGCTATTGTC GGTTT 6115 

25 (2) INFORMATION FOR SEQ ID NO: 149: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 104 01 base pairs 

(B) TYPE: nucleic acid 
30 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 149: 

35 





TAGATACTGG GnTAAAcaTc AAAAATAtyT 


GCtTaTTCaC 


GTGTTTAcGc 


TCCCtCAAAC 


60 




GCAACGTTAA TTGCGTGTAA TCATTTAGTG 


TGAATTcAGA 


CGCTTCTTCC 


ATGACTATGT 


120 


40 


CTGATATGCC 


TTTTATCGAC 


TTTATTTTCT 


CTGGGTTATC 


TAATCCTTTA 


AACAAAAAAA 


180 




CTGCGCCGTT 


TGGCAATTCA 


ACTTTGTTAT 


CAGTCTTATT 


CCAAAGGCAC 


ATGTCCCAAA 


240 




TACCAAAGTT 


TATCAAACAA 


TCTTTAACAT 


CTTCGAACAA 


ACTATCTITA 


ATTGTTGATT 


300 


45 


GTACTTTTCT 


AAGCCACAGT 


ATACGCCTAG 


GATATTTCCA 


ATCTTGCAAT 


GCTTTGAGTA 


360 




CAACTTTTTG 


TATAACGCCG 


TGAGACTTAC 


CGCTCGAACC 


TCCACCGTAA 


TGkACTTCAG 


420 




TGAAGTtATC 


GTAATTGGTT 


AGTATTTCGA 


ATATGTTTCT 


ATTGAAAACA 


TTAGACGGTT 


480 


SO 


TGTTAAAGTT 


TAATTTAACT 


TTCGTCATCG 


TACTCACCAA 


TATTAATCTC 


AATATTCTTC 


540 




TGAGTAATTT 


CTTTTTTATC 


GATATACGCA 


CCATGTACTT 


TTAGTATGTG 


GTCAATAGAT 


600 
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TTTAAATGGT 


CATATTTCTT 


ACTGTAAGCC 


TCTTGAGGTT 


CTCCTCTAGC 


AATAGAAGCA 


720 




GATAACGCTA AAGCTTCTGT 


AATACTCATT 


AAACGCTCTT 


CTTGTATCTG 


TTCTAATCGT 


780 


6 


TfTTTl IT & T 


*%X ILUinnAv. 


ATTAACATTT 


CTTAACAATC 


GACTTGCTAA 


AGACTCTGCT 


84 0 




ul 11 ItXl AV- 


TATAAC CTGC 


TGTAATTGCT 


GCTTTTTTAC 


CATTACATCC 


ATTCATTATA 


900 




TATTCATCTG 


CGAATCTCTT 


TTGTTTTTCG 


TTCATTTCAT 


TTACCAC CAA 


CTCTCGOGCT 


960 


10 


ATACG CTTTT 


TAAAATTAAA 


AAAGGATTGG 


CTATAATCAG 


CCAACCCACA 


TAGATC CTTT 


1020 




ATTCCTAATT 


GCGATAAGGG 


AAACGCAGTA 


CGATAGTCAA 


TATCCTACAC 


TATCATAATA 


1080 


1$ 


TCTCATTTAA 


GGTATCAAAA 


ACTGCCACTT 


TACTGCGAAT 


TTCAGTCTTC 


CCCTAACTCT 


1140 


TCCGCCAATC 


TAGATATGAT 


TTTTCTTTTG 


ATTCTATGAG 


CAGTTCTATC 


AGAAATGTGT 


1200 




ATGTCAACAC 


AAACTTTCAC 


TAATTCCTTT 


TTATTAAAAT 


AATACTCTTG 


AATGAATTCG 


1260 


20 


CGTTCTTTCC 


TGCTTGATGT 


GTTGATTATA 


CGTTCAATAG 


CGCTCTTAAA 


CTCAAGGATT 


1320 




TTACCTCTTC 


GTATACTACA AAGATAATTA 


GTTACTGCCA 


TTTCTGTTTT 


CGATGTATTA 


1380 




GACGGTACAA 


ACTCCCCGCC 


TATATTTGTA 


TCTGTTGGAA 


TCCACGGTGT 


CATTATTTCA 


1440 


25 


CTTCTTAAAT 


CTTCAAGTTG 


TTTATGATAA 


TTAGGATAAT 


CACACAACTC 


ATCTTCTAAC 


1500 




TTTCGAACTG 


TTGATAATTT 


TAATCCGTAT 


TTCTTTTTAG 


TCATGAATAC 


CCTCCGTACA 


1560 




AATATGTTTA 


ATCTTCAAAG 


TGTCTCAATC 


TACTTCTTAA 


TATCTCTATC 


TCTCGCTCTT 


1620 


30 


TAA CTTTT AC 


ATCACCTTTT 


AACTGTTCCG 


CTTGTAACAT 


CACACCAAAC 


AATAAGATGA 


1680 




CTAGTAATAT 


AATTGCTATG 


ATTAACCACA 


TCATCTACTC 


CGACACCTCC 


GCCCTCATCA 


1740 




AATCAGACTG 


ATCACTCAAC 


TTTGCGAAGT 


CACTTGGCGC 


CTCTACATCA 


TCATTAGCCG 


1800 


35 


. TCATGATAAT 


ATATACTTGC 


TCAGTTACAT 


ACTTACCTAA 


CTCATACATC 


GCTAGTAAGA 


I860 




ATAATAGTCT 


CAAAATTTCT 


TTAACCACCA 


CTAAACACCC 


CATGTTAATT 


TATCGATAAT 


1920 


40 


TTGT AT AG CT 


TGTTTTAATG 


CGTCTCTTTT 


TTCTTTGATA 


TCTCTATTAT 


CGCCATCTTC 


1980 


ATCAGCTGAC 


ATTAACTCAC 


TGTCATATTC 


ATATAATAGT 


TCTGATATTT 


CATTACTAGC 


2040 




TACTACTAAT 


AAGTTTTCAT 


CTACATCAAT 


CGTTACCGTT 


TTCTTTGGCA 


TCTCCATCTC 


2100 


45 


TCCTTATCTT 


AACTTGTGCC 


TCGTATTTGC 


GCTCAGCTTC 


TTCTTTACTC 


TCTGCCTCAA 


2160 




CAACTGTAAA 


CGTCTGATTA 


TCTCTAGCAG 


TAGTAAAATG 


TTCATGTGGT 


TGTCCTGTTG 


2220 




AATCTTTGAA 


TGTTGTGACT 


AAGTATTGCG 


TCACTTCTTA 


TCACTCCTTT 


GAATGATTCT 


2280 


50 


AAGTTTTTCT 


ACGAATAAAA 


GTATTAGTAC 


AACACTCAAT 


GTAGCCAACA 


taittttttg 


2340 




CTTTGCAAAA 


TCTACTATAA 


CGATTAAGAC 


TAATAACATT 


CCAATTCTGC 


ATGTAAATAA 


2400 
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TACAAGTATT GGAACTAATG TAATGATGTA ACTCACTTCC CCAAAACCTC CTTGACTCGA 2520 

TCTAAGATGT CTTTACACTC CGCTACTTCC GAAGCCTTTT TCTCCACGTT CTGAAACACT 2580 

6 TTCGAATTCC TCCACTTGCT TTAGTTCAGG TGTCCATATA GGCACGATAA CCAATTGAGC 2640 

TAGTTTGTCT. CCTTCGTTGA TTTGATAAGT TCCGTATTGT CTTATGGCGT CACTCAAATC 2700 

GATTTCTCCT TTAATATCAA AAACACCTGG TGTGATATAA CCATTCGATG CAATAGCGTC 2760 

10 

ATTCTTGATA TTAATCCCTA AATTGCCGTG ATATCCCGCQ TCTATCTTGC CTGTTTCAAT 2820 

CACTAAATGC GTTTTACTAC TTACACCACT ACGGCTAGTT AATAGTCCGA CATAGCCCTC 2880 

TGGTATGCTT ACAGCTACAT CTGTTTTAAT CACTGCCTTT TCTTGTGGCT CAAGTACGAC 2940 

15 

AGTTTCAGCT GAOAATATGT CATAACCTGC ATCOGTCTTA TGATTTCGTT CGGGCATTCT 3000 

AGCATTTTCT GATAATAGCC TTACTTGTAA TGTGTTAGTC ATTTTCCTGC TCCTCCCTAG 3060 

2o CTGTAGCAAA CGCTATTCTC AATTTCAATC TTTCAACAAT ATGAATTAGT GCGGTATTGA 3120 

GGAATATTTC AAATTCTTCA ATGTTCTCAT CTATAAAATC AAGTATTTCT TCCTCTTGTT 3180 

CACTGTCAAA CTCGCTTAGT ACATCCCAAA TATTTATGTC GCTTTTGCTC GTTTCTAATA 3240 

25 CTCTTTTGAT TATTTCTGAA TTACTTTTAT TACTCATTTT CCTTGTTCCT CCTCATATTT 3300 

ATAGACAACT TGACCTGCCA TAATCCCTAC TGCTTCATCA AGTTCAATAC CTTCTTTAAC 3360 

TGAATGTTGA ATAGCATTTG TCATTCCCTC AAGTATTTCA TCAAACGCTT GTGCTCTCTT 3420 

30 ATACACGTCC TCAATCTCTT TTAGTAATCC CTCTGTGTCA TTACCGTTAT -ACGCACTAGC 34 30 

ACTGATCACT GATTGTTCAA TTTGTTCGCG GTTATTCATC ATTTCCATCT CCTCTAAAAT 3540 

AAAGTTAGTT GCTTCTGCTC CTCGTATTCC AAACCATGTT GCTTTATATA TGTTTCGAGC 3600 

35 TCTTCCGCTG TATCAAATGT CTTTTTCACG CCTTGCCAAC CTGGCACGAT ATGCCCATGa 3660 

AAGTRATAAG TGCCGTTCAC TACATGGATA TGTGCCACTC GTTCGTTATC CTGATACAGA 3720 

TATCTCTTAG ATCCGAAAAA TTGGTTTAAG TATTCTTTAC ATGCGCTATC GGTTTTAGGC 3780 

40 

ATTTATGCTT CCTGCCATTT CTTAAACATT TGGTTATAAG TAGTATCAAA CCAGTACGGA 3840 

TCACGTGAAT GTTTTTGAGG CACATTAAAC AAATGTGGCT TCTTCTTACG TAGTTCAGCC 3900 

TCTTTACGTC GTTGCCTAGC CATTTCACGC TCTTTGCTCT CTCGCTCCAT GATTTTGGAT 3960 

45 

AACACAATTT CTTT AT ACT C AGCTAAGGGC AT AC CAT AAG GTGCATGTAA GGCTTCTAAC 4020 

AACGCCCAGC CACCTCGTAC TCTTTTTGCA ACCATTCCTG GAGTTAAACC GTTCTTTTTT 4080 

so ATCAATTCAT TTTCATGTTC GGTAAATTTA TATGGTTTAc CGTTAATCTT TACGATACTC 414 0 

ATTTATTCCA CCTCTATACA TTTACTTTTT TTAATCCAAT CCTCTAATTT GTGCGTGTTG 4200 
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ACATTTAAGT 


TAACCATCTC 


AGCTTTTCCG 


TTTTTATATC 


CACTAATAGT 


TGATCTTGAT 


4320 




ACGCCAGTTT 


CATTGTGCAA 


ATCTTGGACA 


CTTACGTTAT 


CTCTAGCCAT 


GATTACCCTT 


4380 


© 


AAATTAGTTG 


CGAATACTtC 


GTTCAACTTC 


ATTTATTCCA 


CCTCTATATA 


TGCATGTCTT 


4440 




ATTOTTATGT 


TGTCATACTT 


TAGTAATTCG 


TCCGGATTGT 


CATCTAAGCG 


CTTTGCCAGC 


4500 


10 


GTATCTTTTT 


CTTTATCCAC 


ATCATCQTAA 


TGCTGATATT 


CAACTTCTGT 


AGGTATTCTT 


4560 


ATATCAATCG 


TTGCGTTTAT 


ATATG CTTGT 


TGTTGCATTA 


GATCACTTCA 


TTTCTCTTTT 


4620 




TCTTTTACGT 


CTGACTTTCA 


CTAAGTCCTC 


ATATACCATC 


CATTCTTGAC 


CTGTGTATTT 


46B0 


15 


AGGCGCTTTA 


CATATCCACG 


TTAAATTCAC 


ATCTCTATAC 


TGATATCTGA 


ATATCTTCGC 


4740 


TTTGATGTTG 


GCAACTTCAG 


TCGCCTTACC 


TTTAACGTCT 


ATAACTTCAA 


CCAGTTTCCC 


4800 




TTCCTTCCAC 


AAAGAGAAAT 


COGCTATATA 


CGTAATCGGT 


CTTTGTTTCC 


CGAATTTAGG 


4860 


20 


TTGTAATTCA AATTTCGGTT 


GTATTTCGAT 


ACGATCATAG 


TTAGTGCCAT 


TCATATTACT 


4920 




TTCTAAATAT 


TGGTAATATT 


CGCACTCTAC 


TTTGCTATCA AATACAATTC 


CTTTGTACTC 


4980 




AACTTTCTTA 


GCATTGTATT 


TACTCATTGT 


GCCACCTCTA AATATCAAAT 


ATCGTTGCTT 


5040 


25 


GCAATCCTAG 


CTCTTGCTCA 


TATAGAAGCC 


CGTGAGCGCC 


TTTGAATCGT 


TTTAGGTCAC 


5100 




TATCAGTCAT 


AATTTTCTTT 


TCGTOGCTGA 


AATGGGCTCC 


TGTGAGCGAA 


TAAACTTCAT 


5160 




TTACGTTGTC 


TTTATACTTG 


ATGACCTTAA 


TATCTTCCGT 


GCCATCTTCT 


CGGTATAAGT 


5220 


30 


AATATTTTTC 


TTTCGGCATT 


TTTTAACACT 


CCTTAATGTG 


TGTTTTCTTC 


CAGTTGATTT 


5280 




CATTCATGAT 


TTTCTTTTCA 


ACTCTGTCGT 


AATCATCGAA 


AGGCGATAAC 


TCGTTATTGT 


5340 




CCAACAATCT 


ATTGACCGCC 


CAACCAGTCT 


CGATATATAC 


ATTTGCTACA 


ATCGGGTCGC 


5400 


35 


TTTGCTTTGT 


CTCTTCATAC 


ATCGATTTCA 


ATAAGCTTTT 


GAATTGCATT 


ATATTCATGT 


5460 




GAAAAACCTC TGAGTCTTCT TGTAATACTC AAATTCAATT ATTCCGGTTT 


CGCCGTCTTT 


5520 


40 


GTTTTTGGCT 


ATGTTACATT 


CAACAATAGA 


TTTGCCAGTG 


ATACTGTCAT 


CTTCGTCACG 


5580 


GTTATAATAA 


TCATCACGGT 


AAAGTAGCAT 


CGCTAAACTC 


GCATCTGCTT 


CTATTCCGCC 


5640 




TGATTCTTTC 


ATGTCCGATA 


GCATTGGTCT 


TTTATCCTGT 


CTAGACTCGA 


CACCACGATT 


5700 


45 


CAGTTGTGAA 


AGTAGTACGA 


TGATTGCGCC 


TGTCTCGTTA 


GCGATTATCT 


TTAAGTCACG 


5760 




TGATATCTTT 


TCTACTGCTA 


CACGTCTATC 


AACTTTCGCA 


TCAGTATCCA 


TCAGTTGAAG 


5820 




ATAATCTATA 


AAAATAACTT 


GTTGCCTGTC 


TGAATGCCTC 


ATTG t TGCGC 


TCGCACATCT 


5880 


60 


TGCGGTGTGA 


TATTAC'IT'IT 


ATCAGAAATA 


TCGATGCCTA 


ATTTCATGAT 


TTTATCCATC 


5940 




GCATTCGTTA 


ACTTTGTTAA 


GTCATCCGGC 


GTTAAGTTCC 


TGATTTCTTT 


TATCTTTGTT 


6000 
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AGACTAAAGA 


AAGATGTTTT 


GTATCCATTT 


TGTGCTATGT 


TCAGCATCAT 


GTTTAATGCA 


6150 

w X ^ V/ 




AAACCTGTCT 


TACCCACTGA 


GGGACGCGCT 


GCGATGACGA 


TTAATTGTGA 


TGGTTCTAAT 


6180 


5 


CCCCCTATTT 


TGTAATCCAT 


TAGCTTGTAA 


CCCGTCTTAA 


TTTGCTTCTT 


AGGGCTATCG 


6240 




CTGTATAACT 


CTTCGACAAA 


CTCCTCAACA AACTTCTTGG 


TTCCATCTTC 


tittttutta 


6300 


10 


GTAATTGTTT 


TTAAATCCTT 


GAGTTCATCA 


ATCAAGTTGT 


TAAAGTTTTG 


GTTCGTAGGT 


63 60 


TGTTGTTTGA ACTCAGTTAC 


CAATTCGTTA 


GCTTTGTTGA 


GCTGATAACT 


TTCCAATAAT 


6420 




TC1TGTTGAT 


AACGTTCAAA 


GAAGCCATAT 


CCAATGAAAT 


CGGAGTTGTA AAGTTTAGTT 


£d fin 


15 


ATAGTATCTG 


CATCTAAAAA 


TTCTTTATCT 


TTAGTTGCTT 


TTAAATAGAT 


TTCTTGATGA 


6540 




TCTATCTTTC 


CGACGTCCAT 


TACATAATTG 


AAAAAGGTTT 


TAAACTTTTC 


GTTCGTAAAC 


oouu 




ATGTAATCTT 


TAACTCTTAT 


CTTTTCTAAT 


ACGTCCGGTT 


GTTTAAGTAG 


CGTAGCGATT 


bbou 


20 


ATTGTACTTT 


CAATTTCGAA 


TTGTCCGTAA 


TTCATTCGTT 


TTCGCCCCCA 


AATTCTGCCA 


6720 




ACTTATTCAT 
GCATTTTCCA 


GAACTTATCT 


AGCGCTATTT 


TTCTTTGTCT 


GACATATTCG 


GGGTCATTCT 


6780 




TTGGTGTGTA 


GCGGTTTCGT 


TATCTACTGG 


CTCGATAGAT 


ACTTTTTTAG 


6840 


25 


GTTCPTTACG 


CATGATTGCT 


GGTAAGTTAG 


GCGGGTACGG 


GTTGTTACTG 


TTGATATAAA 


6900 




CATCTACCGC 


TTTTACAGTT 


GGTTGATAAT 


CTCCATTTTG 


ACTTAATACA 


TCAATCCACA 


6960 




TTTCTAACTT 


CGGTTTATCA 


AAATCAATGT 


TGTATACGTA 


CCTAACTTTT TTAATAATTT 


7020 


30 


CTAATGCTTG 


TGTTTTGCTC 


ATCGGCATTA 


GTCATCACTC 


AATTCTTTTT 


CCATTTGTGC 


70B0 




AATGACATCA 


TCAGTAGTAT 


TTTTTCTAGG 


TGCTATTTTA 


TTTTCTGCAT 


CTTCTTTTGT 


7140 


35 


TTTGACATTC 


TCTTTAGCCC 


AGTTGTTTAA AACTTTAATT AAATAGCCAC 


CATGGGCACT 


7200 


TTTGCTTTTA 


GTGTACTCAA 


CACCTACTTT 


TACAACTTCA 


AAAGCGTTTG 


TACCTATATC 


T O C f\ 




ATCAATAGCA AACCCTAATT 


GTTCCATTTG 


ATTAGGTGTT 


AACTTATCAT 


CCAAATTTGC 


7320 


40 


AATTATATAT 


TTTATTGAAG 


ATGAGAAGAC 


GGCTTCTCTT 


TCTTCTTCTT 


TATTCTTATA 




TTCTTCTTCT 


TTTTCTTCTT 


CTCTTTCTTC 


TTCTTCTTCT 


GTATCGTTAC 


GTAACGTTAC 


7440 




GGTAACGTTA 


CGTTTTGCTT 


CTAGTAACTT 


TTTCTGTTTC 


TCACGATAGC 


GTTGTTGTCG 


7500 


45 


CAATTTATTT 


TTTTCTTTAT 


GCTTAGCTTT 


GCTATCTAAG 


CTTTGATGCT 


TCTCCCAGTT 


7560 




TGTCACUU'IT 


ATGACACCAT 


taactttttc 


AATCATGCCC 


AATGTCTCAA 


AAGTTTGAAT 


7620 




TGCTAACCTT 


ATTGAGTTAA 


TAGGTCTATT 


AAATTCATTT 


GCTAACATTT 


CTTCGTTGTA 


7680 


SO 


CGGCAAGTTT 


TCGGATAGCA 


TAATATAACC 


TTGTTCATTG 


TACTTTCCTG 


ATAAAGTTAG 


7740 




TAACTTAACC 


CAAATAGTTA 


TGATCGTATC 


TCTTTCGGGT 


AAAGCTTOGA 


TATATTTGAT 


7800 
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10 



15 



20 



25 



30 



35 



40 



45 



60 



CTCCTTTCAG CATTTTGTTG AGCCTCTCAT CAACTTTTAT CCACGAGTCA TGCAAGTGAT 7920 

ATTTATCATC AAACGACTTA ACOCCAATTG CGTGCTGTTC ATTATGATGT TGTCTACACA 7980 

GTGCTAACAC ATGTTTGTCG TAGTGATTCA TTTTGTTTCT GTTCATGCCT CTGCCGACTG 8040 

CTTCATAATG TGCCAGGTCT GCGTGAGGCT TTCCGCATAT TACACAGTTG CGGTTGATTG 8100 

TAGCCCAATA TAATAACGCT TTATCTTCGC TTAACAACTT ACTCGTTTCT ACACTCATAG 8160 

GTATTTOATG ATGAAACATA AACGCTATAA TCAGTTCTAT TAACTCCCTT GCAACTTTCA 8220 

TAGAACAGTC GCGCAGACTG ATTTCTTCAT AACCTTTCAT AATTTCCAAT TCTGTTTGTA 82 80 

ATAATTTTCT AGTTGATTCT ACTGGTTCGC CCCAGTGAAG TTCTATATCT CTACACATTG 8340 

CGAATATTTT TTTGCGTTGT TCTATAGATA GTTTTTTATT GTCCGGAACC TCTACTTCTG 8400 

CTTTTAGTGG ATATCCGTTT TCTAGTAAGT CAATGTGACT TTGTTCAAGT TCAACACCAG 8460 

TAGCAACGAC GGAATAAGTA CCGTCATTGT CTTTCTGGTA TCTTGTAATG TATTGCATTT 8520 

AAACCACGTC CTAGAACGGT AAATCATCAT CATTGATTTC TATTGGACCA TTAGCATTAG 8580 

CGAATGGGTT TGATTGTTGA CTCATTGGCG TCTGTTTCCC ATTTGCTTGC TGTTCTTTTT 8640 

GTTTCATCTC ATCAGTTTTA GGTTCTGGTT TATTAACTAC TTCATCGTCT TTATTCCAAA 8700 

CTTTTACATA TGAGAGTCTT ACAAAATACT TGCCTTGTTC CTCGTTAAAT TTATTTTTAA 8760 

GTACAATAGT TCCGATTTTG TTAATTAATT GATCTGTGTC AAAAGTTAAA TCTGGTAAGT 8820 

TCAATTTAAT TCCTAATCTA CTAAGTAACT CGATATATTG TTTTTCTTGA TAATCTTGTT 8 8 80 

GGAATGGTGG GACGAATTGG TTGTGTTTGT ATTGTTTACC TTCGTTGTTT TCAAAAACAA 6 940 

TCGTGAAGTA TCTGTTTTCT CTGTCGTTAA ACTCGACATT TGCAACTTTT ACTGTAAATT 9000 

CTCCAGGTCC TAAAAAGTCC CCACCTTTCA TGAATGCCTC TTGATTAGTT TCTTGAATGT 9060 

ATTGTGTTCT ACCAGTGATT TTCATAATTT TTATACCGTC CTTTTAATTA ATTTTTAATT 9120 

ACCATTTCTA ATTGCTTGTA CAACATCGTT AATACTTGGA TTAATGAAAC GTTTGTTGTT 9180 

AATTTTGATG TTGCTTGAGT GTCTTATCTT TGTCTCGAAT AAATTTGATG GTTCAGCGTT 924 0 

AAGTACATAT TGATAAGTTT TTTCGCCGTC TTGCTCATGT TCTTCTATTG TCATTCTTGC 9300 

TAACACGTCA GATTGACTGA TGACTGCTTT TTTTATTTGG TCTTGTGCCT CTAT CGTGAT 9360 

TGTTGGATTG ATAGTACTTC CCT CAT CATC TTTGTCTTTG TTAATGCCCT CGTGTCCGCT 94 20 

TATAGCAAGA TGAAATTGAT AATGTTCTTG TAATTTAGAA ATATAACGAT AAATACTTAC 94 80 

AATGCGTGTA GCACACTCGC CCCAATCATT AAATGTCGGT TTCTTTGATT TACCGTCCAT 954 0 

GATGTCGTCC ATAGTGATAT CACGTAACTT TTGGATTGTT TCAATCACTA CAACATCAAT 9600 
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AAAATGCTTA TAATTCTTAA TCTGCACAAC TGCCCCATCT TCTGTTACCG TTGTTCCGTC 9720 

CTCATTTATA TCTAGTACTA AGGCATTCTT ATCTTTTGTT AAAAACGTAO TTTTACCAGT 9780 

5 ACCGAACTTG CCGTATATCG CAAATTTATA AAACTTGTTT GCATTTTGTT TGCTGATGTC 9840 

TTTTACACCT AGTTGCGTTA AAATATCGAC ATCTTGATTA GTTTTTTCAG TCATCTATTC 9900 

TCCCACCTTT ACCGTGTATG ACGTTGGTTT CTCCACAATG CTAGCACCCT CTAAAACTTC 9960 

10 

GCCGTTTGCG TCAATCAATG TGCCGTTTTC AGTTACATTG AAATCTTTCT TAATGTCTGA 10020 

TTGGCTAAGT TTTTTAGTTA CTTTTACATA GTTGTCAAAA CCTOGTTGCT CAAGTTGTnT 10080 

is AATGACTTCT TGCTCATTGC TAACTTGAAT GACTTTTGAA CCTTTTCTGG CTGTCACTTT 10140 

TCCGTAAGtG TATTCAACTT GAATTTGCTA TCTTGTTCTT TTTGTATTCT GTAATATTCA 10200 

ATTACAAGGC TTTGTAAATA TTCTTTGCCA CTCTGTAATT TTTCTACTTC TTTATCTTTC 10260 

20 CATTCGTTTA TGCGTTCAAT TTCTTTATTT GCTAAATCGT TGATTTCATT CTCTTTAGTT 10320 

GTGATTGCAT CCAGTTTCTn AAAAACCCAG TTAGCACTGT CTAGATCAGT nACTTTGAAT 10380 

CGGTCGTCTT GTTCGAATGT n 10401 

25 (2) INFORMATION FOR SEQ ID NO: 150: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2989 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 150: 

35 

TTTCTCTCTA TTATTCTCGA TGCGTAGATA ATTGTTTAAA TTTAAGTTTA TAGTAATGTT 60 

GAGTTTATAA TTTCATATAT CTAAAAACAG GTGTTGTATA TATAATCATT CATCTAGTTA 120 

TACTTACTTT AAAAATAATA TAATTTCATG CGATGCAATT CATTGATGGA TGTTTTTAAT 180 

40 

CTTAATCAAA TCCAaATAAA G CATAT ATTT TTAAATTCAC TTTCTTTCGA ATCGATTTTT 240 

ATCTCTTGnA TTAAACTTTT CCATTGTTTC ATTAAAGCTC TCTGTCATAT CTATTCCCAT 300 

45 TGAATTCGCT AAACATAACA ACACAAATAA ATTATCACCT AATTCTGCTT TAATCGTATT 360 

TGCTTCCTCT GAATCTTTCT TCTTTTTTTC ACCATAGGTA TGATTTATTT CACGTGCAAG 420 

TTCGCCCACT TCTTCAGTCA ATCTAGCTAA GTTAGCTAAT GGTGAAAAAT ATCCTGTTTT 480 

SO AAATTGTCCA ATATATTCAT CAACTTCACG TTGCATTTCT ACCATTGATT TCATTTCTAC 540 

GTTCTCCTTA TATTGCATTT CTAATATAGT ATATATCAAT TTGAAGTCTC ATGCATGTTT 600 
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10 



IS 



20 



2S 



30 



3S 



40 



46 



50 



55 



AATTCAGTTT ATATAAATGT AATGCATTCC TAACTAAATT AAATCAATTG AAATTGGGAT 


720 


TATAACTTTA 


TGATACGTAC 


CACTACAATA 


AAATAATATA 


GTGAATAATC 


TACCATTAGA 


780 


AAAATAAGCA 


CAAAAAAACT 


AGCAACCACA 


CAAAAATGTG 


ATTAGCTAGT 


TAATAAGTGT 


840 


CTAATTTAAG 


TTAATTGTTA 


ATCTATAAGA 


TTAATCACTT 


GAACGCGCAA 


TCAAAATAAT 


900 


ACGTACAAGC 


TCTGCTACAG 


CGACTGCAGT 


TGCTGCAACA 


TAAGTCATTG 


CTGCTGCAGA 


960 


TAATACTTTA 


CGCGCATGCT 


TGTATTCTTT 


TTCATTTACA 


ATGTTCAATG 


CCGTAATTTG 


1020 


TTTCATCGCT 


CTTGAACTCG 


CATCAAACTC 


AACTGGTAAC 


GTAACAATTG 


AGAATAATAC 


1080 


CGCTAATGAC 


ATTAAACCAG 


CACCAATCCA 


TAAAGCAGTT 


GAACCaAATG 


CACTACCTAT 


1140 


CGCTGTTAAG 


ATAATACCTA 


ACATGATGAT 


CATATAACTT 


AATGAACTCC 


CTAGGTTTGC 


1200 


AACAGGTACT 


AATGCTGCTC 


TGAATCTTAA 


GAACCAATAT 


CCTTGGTGAT 


CTTGAATGGC 


1260 


ATGACCAACT 


TCGTGGGCTG 


CAATTGCAGT 


TCCAGCAACT 


OATGGTCTGT 


CATAGTTTGC 


1320 


AGGAGATAGT 


GAAACAACTT 


TCTTTTTAGG 


ATCGTAATGA 


TCTGTTAAGA 


ATCCTTCACC 


1380 


TTTAACAACT 


T CGACAT CAT 


AAATACCGTT 


TGCATGTAAA 


ATTTCTAATG 


CAACTTCACG 


1440 


ACCCGTTTTA 


CCACTAGTTG 


ATCTAACTTG 


TGAATATTTC 


TCATAGTTAG 


ATTTAACTTT 


1500 


GTGTTGTGCC 


CATAAAGGAA 


GCACCATTAA 


TATTACGAAA 


T AAATT AT CA 


TAGTAAAAAT 


1560 


TGAAGACAAT 


AAACTCACTC 


TCCTTTATAA 


ATATTTTACT 


GTCATTTGCC 


GTTTTTATCA 


1620 


AATCATTTAC 


ACTTTAATAA 


TTTGTTTAAT 


TCAATATAAA 


GCAAAAGTCC 


AAAAACACTT 


1680 


AGACAACATG 


ATAATACACC 


AATTTGCCAC 


ACATGTGTAG 


TTATAAAATC 


ATAATATGGA 


1740 


AATTGAAGGT 


GAAAATAGTC 


AATATAATCA 


TTCAAAAACA 


CCCAAATCAT 


yGCTACACTG 


1800 


ATTCCAATCA 


TAGAACGTTT 


AAACCTAGGA 


TAGAAGTAAA 


TTGCCTGAAC 


AGCCATTATA 


1860 


CTGTGGGAAA 


ACATTAATAC 


CAAACCATTT 


ACTGTAATAT 


CACCTTGTTC 


AATAATAAAT 


1920 


AATATATTCA 


TTATAACTGC 


CCAAATCCCA 


TATTTGAATA 


ATGTTACAAA 


TGCCAGTGCA 


1980 


TCGATAATAC 


TATTTTGTTT 


TTGAATTAAT 


ATCAATGAGA 


TAGAAATAAC 


TAAGTATAAT 


2040 


ATTGCAGTTG 


GGCTATCTGG 


AACAAAAATC 


TTAAAATGCC 


AGGGCGTATG 


ACTTAATTGT 


2100 


TCACCATACC 


ATATATAACC 


ATAAATCATC 


CCTAATATAT 


TACAAATGAG 


TAGCATCATT 


2160 


AACCAAGAAC 


GTTGATAAAG 


TGTATATTGC 


CAAAATGCTT 


TAATTGT CAT 


CTGCTAAGTC 


2220 


CTCAAATTGA 


TTATG TTT AT 


TTACTAGCTT 


GAGTGTATTT 


AAAATTTGCG 


TTAGTTGATA 


2280 


AAAACGTTGC 


TTTTCATTCA 


TCTGTAAACT 


TAAATCAATA 


TTGTGTAACA 


AGTAATCTAT 


2340 


TAATAACGCA 


TGTTTATGCC 


GATCTATAGC 


CATACTATTT 


AAGTCATGAA 


GATAAGTTTG 


2400 
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TGACACGTTT GCGAAGTGAA TTTGAATATC AAAAGCACAG TTATGATTAG CGATATAATC 2520 

AAATATTTCA TTTGTATTCA TTAACTTTAT ATTAOGCTTA GTAAATTGAA TTGCAGAAGC 2580 

5 GTGACTTCCC ACTTCTGCAA TTTCTAATGT TTCATGATGA TTAATTTTTG TATCTACAAA 2640 

ATGAATGTTT GCCAATTTCG CCTCATTCAC TTTTATATAG TTAAGCACCC AAACTGCAAT 2700 

ACGCOACTTA AATCGATATT GAAAAAGTAA ATATTCAATA AAACTTTCTT TAATTTGATT 2760 

10 

GAGTGTCTCT GACATCAAAT ACCCCATTTT AAGATTGCAA TCTTGaTAAT TCGTCATGCC 2820 

AATTTTCGTT ACTTGGcTCT AGTTCCAACA ATTGATTTAA AATAGTAATT GCTTGTTCCT 2880 

15 TTTGACCAAT TTCAATTAAA TAGAAATAAT AATCACTCAT AAAATCAATA TTTGTTTTCA 2940 

TCGTTGGATA TGCTAATTCA AAGAAATOTT GAGCTTCTTT ATCTCGCTC 2989 
(2) INFORMATION FOR SEQ ID NO: 151: 

20 <i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1143 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 

25 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 151: 





CATCAACTCC 


TTAATTACAC 


TGTAAATGAT 


ATGCGTCTTT 


TTGACAACTA 


TATTTGTCAA 


60 


30 


ATCTACACCA 


AAAAATATGA 


TTATCCACCT 


ATGTATGACA 


TTTTGAAACA 


AACACCTCAA 


120 




CGCCTACAAG 


T CAT AATTG T 


TTACTTTCGT 


TACACCTTCC 


TGCATAATTA 


ACAGCATTCT 


180 


35 


AATTTTAGTA 


TGATGCACGC 


ATTTTCACTA 


AATCAAACCA 


TTCAAAGGAG 


ACTATTATGG 


240 


CATTTACATT 


ATCTGCAATT 


CAACAAGCAC 


ATCAACAATT TACTGGTGTT 


GACTTTCCAA 


300 




AACIATTCAA 


AGCTTTTAAA 


GATATGGGGA 


TGACTTACAA 


TATCGTCAAC 


ATTCAAGATG 


360 


40 


GCACTGCAAC 


ATACGTACAT 


CAATCAGAAG 


ATGATATCGT 


TACGTCATCT 


GTAAAAAGTA 


420 




ATCATCCTGT 


TGCTCAAAAA 


TCAAACAAAA 


CAATAGTTCA 


AGACGTCTTA 


ACTAGACATC 


480 




AACAAGGGCA 


AACAGATTTT 


GAAACATTTT 


GTGATGAAAT 


GGCTGAAGCT 


GGCATTTATA 


540 


45 


AATGGCATAT 


CGATATTCmA 


GCGGGCACTT 


GTACTTATAT 


CGACTTGCAA 


GACCAAGCTG 


600 




TTATTTCAGA 


ATTAATCCCT 


CAATAAACTA 


TATTTATAGC 


AACATTTTAA 


TTATTTCATA 


660 




AAATTTTATT 


GATAATCATT 


ATCGTTCGGT 


ATAAAGTAAA 


TACTATATAC 


TACTTATGAG 


720 


SO 


TGAGGTTGAT 


TATCATGATA 


ACTAACACTT 


TTATTTTAGG 


CATCACAGGC 


CCAACAAGTC 


780 




. TTGTCGTCAT 


TAGCATTATC 


GCTTTAATTA 


TTTTTGGTCC 


GAAAAAATTA 


CCACAATTTG 


840 
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AGTCTCACGA TACACCCAGT AAGGAATCGA AACAACAGCG AGAGCAATAG CACTGACCAC 960 

ACCTTACTGG TTCACTTTAO COAACTACQC CATCGGTTAG TAAAAATTTT ATTGTCOTTC 1020 

GTCATTACGG TCATCGTCGT ATATGTyTCA TCATTTTGGT GGATGACACC ATTCATAACG 1080 

TAT ATyACC C GgCACATGTG TcCTTACATG CATTTcATTC ACAGAAATGA TAGAAATAAC 1140 

GTG 1143 



10 

(2) INFORMATION FOR SEQ ID NO: 152: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7953 base pairs 

(B) TYPE: nucleic acid 

15 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 152: 





CAACGCCTGA 


ACGTAAACCA 


TATCGTTTCG 


CGATTTCCTC 


ATCTTGACTA 


TTTACTAAAA 


60 




X V> X V— X Vnx/t X 




v> xxx<»xxxxx 


PTTfTTTAftT 


TAATGGTAAT 


TCTAACTCAG 


120 


25 


CTGCTTTTTG 


ACGCAAAGTT 


GGATGACCAT 


CTCTAATGAT 


GTCTTTCATT 


GTTAACATAT 


180 




ATTGCACCTT 


CCTTATTTTA 


ATTTGTTTTA 


GTTGAATGAC 


AGTAAAAAGG 


TTGTTAAGAT 


240 




ACTCATACAT 


TTTTATGTGT 


AAATATCTAC 


AAAGTTAACC 


AACTACTGCC 


AATGTTTATT 


300 


30 


TTAGATAGTA 


TATGTAAATT 


TTCAaGAtAT 


GCgTAATTGC 


gTTAAAAAAT 


GaTTAAAGTG 


360 




TTGGTTTCAA 


GCAATGaTAC 


TTTAGAAATT 


TATTTATCAT 


CTTGACTTTA 


AAAATTATAT 


420 


35 


TATAAATGAC 


GTAACTGTCA 


ACAGATATAC 


TTAGTArTGA 


AGATGTGTAA 


TGTAATTGTT 


480 


TAAAATTGAT 


TTCCAAGCAG 


ATTTTATTTA 


TCATTTAATT 


TAAATAGCAA 


GTGGAGGTAC 


540 




AAGTAATGAA 


ATTTGGAAAA 


ACAATCGCAG 


TAGTATTAGC 


ATCTAGTGTC 


TTGCTTGCAG 


600 


40 


GATGTACTAC 


GGATAAAAAA 


GAAATTAAGG 


CATATTTAAA 


GCAAGTGGAT 


AAAATTAAAG 


660 




ATGATGAAGA 


ACCAATTAAA 


ACTGTTGGTA 


AGAAAATTGC 


TGAATTAGAT 


GAGAAAAAGA 


720 




AAAAATTAAC 


TGAAOATGTC 


AATAGTAAAG 


ATACAGCAGT 


TCGCGGTAAA 


GCAGTAAAGG 


780 


45 


ATTTAATTAA 


AAATGCCGAT 


GATCGTCTAA 


AGGAATTTGA 


AAAAGAAGAA 


GACGCAATTA 


840 




AGAAGTCTGA 


ACAAGACTTT 


AAGAAAGCAA 


AAAGTCACGT 


TGATAACATT 


GATAATGATG 


900 




TTAAACGTAA 


AGAAGTAAAA 


CAATTAGATG 


ATGTATTAAA 


AGAAAAATAT 


AAGTTACACA 


960 


SO 


GTGATTACGC 


GAAAGCATaT 


AAAAAGGCTG 


TAAACTCAGA 


GAAAACATTA 


TTTAAATATT 


1020 




TAAATCAAAA 


TGACGCGACA 


CAACAAGGTG 


TTAACGAAAA 


ATCAwAAGCA 


ATAGAACAGA 


1080 
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AAGAAAAGCA AGACG TTGAT CAATTTAAAT AATTAATATA ATACAGATGG TAGGAAACAA 1200 

CTAATACAGT TCCTATTATC TGTATCTTTT TTTATTAAAA CAGAACTTTT TCAAATGGTT 1260 

s 

TAACAGTCCC ATTTATTTGT GGTACAATTA GTAAGGATAA AATGAATTTC TATACAATTA 1320 

TGGGAAAGGT ATTGTGAATT GAATGGCTCC TAAGTTACAA GCCCAATTCG ATGCAGTAAA 13 80 

AGTTTTAAAT GATACTCAAT CGAAATTTGA AATGGTTCAA ATTTTGGATG AGAATGGTAA 1440 

10 

CGTCGTAAAT GAAGACTTAG TACCTGATCT TACGGATGAA CAATTAGTGG AATTAATGGA 1500 

AAGAATGGTA TGGACTCGTA TCCTTGATCA ACGTTCTATC TCATTAAACA GACAAGGACG 1560 

1S TTTAGGTTTC TATGCACCAA CTGCTGGTCA AGAAGCATCA CAATTAGCGT CACAATACGC 1620 

TTTAGAAAAA GAAGATTACA TTTTACCGGG ATACAGAGAT GTTCCTCAAA TTATTTGGCA 1680 

TGGTTTACCA TTAACTGAAG CTTTCTTATT CTCAAGAGGT CACTTCAAAG GAAATCAATT 1740 

20 CCCTGAAGGC GTTAATGCAT TAAGCCCACA AATTATTATC GGTGCACAAT ACATTCAAGC 1800 

TGCTGGTGTT GCATTTGCAC TTAAAAAACG TGGTAAAAAT GCAGTTGCAA TCACTTACAC 1860 

TGGTGACGGT GGTTCTTCAC AAGGTGATTT CTACGAaGGT ATTAACTTTG CAGCAGCTTA 1920 

25 TAAAGCACCT GCAATTTTCG TTATTCAAAA CAATAACTAT GCAATTTCAA CACCAAGAAG 1980 

CAAGCAAACT GCTGCTGAAA CATTAGCTCA AAAAGCAATT GCTGTAGGTA TTCCTGGTAT 2040 

CCAAGTTGAT GGTATGGATG CGTTAgcTGT nATATCAAGC AACTAAAGAA GCACGTGACC 2100 

30 

GCGCAgTTGC AGGTGAAGGT CCAACATTAA TTGAAACTAT GACATATCGT TATGGTCCTC 2160 

ATACAATGGC TGGTGACGAT CCAACTCGTT ACAGAACTTC AGACGAAGAT GCTGAATGGG 2220 

AGAAAAAAGA CCCATTAGTA CGTTTCCGTA AATTCCTTGA AAACAAAGGT TTATGGAATG 22 80 

35 

AAGACAAAGA AAATGAAGTT ATTGAACGTG CAAAAGCTGA TATTAAAGCA GCAATTAAAG 2340 

AGGCTGATAA CACTGAAAAA CAAACTGTTA CTTCTCTAAT GGAAATTATG TATGAAGATA 2400 

TGCCTCAAAA CTTAGCAGAA CAATATGAAA TTTACAAAGA GAAGGAGTCG AAGTAAGCCA 24 60 

40 

TGGCACAAAT GACAATGGTT CAAGCGATTA ATGATGCGCT TAAAACTGAA CTTAAAAATG 2520 

ACCAAGATGT TTTAATTTTT GOTGAAGACG TTGGTGTTAA CGGCGGTGTT TTCCGTGTTA 2580 

4S CTGAAGGACT ACAAAAAGAA TTTGGTGAAG ATAGAGTATT CGATACACCT TTAGCTGAAT 264 0 

CAGGTATTGG TGGTTTAGCG ATGGGTCTTG CAGTTGAAGG ATTCCGTCCG GTTATGGAAG 2700 

TACAATTCTT AGGTTTCGTA TTCGAAGTAT TTGATGCGAT TGCTGGACAA ATTGCACGTA 2760 

60 CTCGTTTCCG TTCAGGCGGT ACTAAAACTG CACCTGTAAC AATTCGTAGC CCATTTGGTG 2820 

GTGGCGTACA CACACCAGAA TTACACGCAG ATAACTTAGA AGGTATTTTA GCTCAATCTC 2880 
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CTATTAOAAG TAATGACCCA GTCGTATACT 
GTGAAGAAGT ACCTGAAGAA GAATATACAA 
5 AAGGTAATGA CATTTCAATC ATCACATACG 

CAOAAGAACT TOAAAAAGAT GGTTATTCTG 
CAATCGATGT TGACACAATT GTAGCTTCAG 

10 

AAGAAGCACA ACGTCAAGCT GGTGTTGGTG 
CAATCCTTTC ATTAGAAGCA CCTATTGGAA 
TCACTCAAGC TGAAAATGTT TGGTTACCAA 

1S 

AAACTTTAGA ATTTTAATAC ATTTTAAAAG 
GATTAAAATG AAATGTTTAA TTTACGAAAT 

20 TTAGATTACC CGATATCGGG GAAGGTATCC 

AAGCTGGAGA TACTATTGAA GAAGACGATG 
TAGTAGAAAT CCCATCACCA GCATCTGGTA 

25 CAGTAGCTGT AGTTGGTGAC GTTATTGTTA 

AATTTAAAGG TCATGATGAT GATTCATCAT 
CAgcAGaGCA AGCACCTGTA GCTACTCAAA 

30 AAGCAATGCC TTCAGTACGT AAATACGCAC 

CTGGATCTGG TAAAAATGGT CGTATTACAA 
GTGCACGAAC AGCTTCAAAT GAATCAGCTG 

35 

CTCCtGCAGC ACCTGCAGCA GTAACATTAG 
TCCCTGCTAT GCGTAGAGCA ATTGCGAAAG 
ATGTAACATT AATGGATGAA ATTGATGTTC 

40 

AAGAAATCGC AGCTGAACAA GGTACTAAGT 
TTGTTTCTGC ATTGAAAAAA TACCCAGCAC 

45 AAATCGTTCA TAAACATTAC TGGAATATCG 

TAGTACCTGT TGTTAAACAT GCTGATOGTA 
ATGAATTAGC TGTTAAAGCA CGTGATGGTA 

60 CATGCACAAT CAGTAATATC GGTTCAGCTG 

ACCCAGAAGT AGCAATCTTA GGAATTGGCC 

55 



TAGAGCATAT GAAATTGTAT CGTTCATTCC 3000 

TTGACATTGG TAAGGCTAAT GTGAAAAAAG 3060 

GTGCAATGGT TCAAGAATCA ATGAAAGCTG 3120 

TTGAAGTAAT TGACTTACGT ACTGTTCAAC 3180 

TTGAAAAAAC TGGTCGTGCA GTTGTAGTTC 3240 

CAGCAGTTGT AGCTGAATTA AGTGAACGTG 3 300 

GAGTTGCAGC AGCAGATACA ATTTATCCAT 3360 

ACAAAAATGA CATCATCGAA AAAGCAAAAG 3420 

TTAACGAAGT TAGCGTATTT TAGTCTCATT 34 80 

CTTAGGAGGG CAAAAACGTG GCATTTGAAT 3540 

ACGAAGGTGA AATTGTAAAA TGGTTTGTTA 3 600 

TTTTAGCTGA GGTACAAAAC GATAAATCAG 3660 

CTGTAGAAGA AGTTATGGTA GAAGAAGGTA 3720 

AAATCGATGC ACCTGATGCA GAAGATATGC 3 78 0 

CTAAAGAAGA ACCTGCGAAA GAGGAAGCGC 3 84 0 

CTGAAGAAGT AGATGAAAAC AGAACTGTTA 3 900 

GTGAAAAAGG TGTTAACATT AAAGCAGTTT 3 960 

AAGAAGATGT AGATGCATAC TTAAATGGTG 4 02 0 

CTTCAGCTAC AAGTGAAGAA GTTGCTGAAA 4 08 0 

AAGGCGACTT CCCAGAAACA ACTGAAAAAA 414 0 

CAATGGTTAA CTCTAAG CAT ACTGCACCTC 4200 

AAGCATTATG GGATCACCGT AAGAAATTTA 426 0 

TAACATTCTT ACCTTATGTT GTTAAAGCAC 4320 

TTAACACTTC ATTCAATGAA GAAGCTGGTG 4380 

GTATTGCAGC AGACACTGAT AGAGGATTAT 444 0 

AGTCTATTTT CCAAATTTCA GATGAAATTA 4500 

AATTAACAGC CGATGAAATG AAAGGTGCTA 456 0 

GTGGACAATG GTTCACTCCA GTTATCAATC 4 620 

GTATTGCTCA AAAACCTATC GTTAAAGATG 468 0 
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ATGGTGCAAC TGGCCAAAAT GCAATGAATC ACATTAAACG TTTATTAAAT AATCCAGAAT 4800 

TATTATTAAT GGAGGGGTAA AACATGGTAG TTGGAGATTT CCCAATTGAA ACAGATACTA 4860 

5 

TAGTAATCGG AGCAGGTCCT GGTGGATACG TTGCAGCAAT TCGTGCAQCT CAATTAGGAC 4920 

AAAAAGTAAC AATCGTTGAG AAAGGTAATC TTGGTGGTGT TTGCTTAAAC GTAGGATGTA 4990 

TTCCTTCAAA AGCATTACTA CATGCTTCTC ACCGTTTTGT TGAAGCACAA CATTCTGAAA 5040 

10 

ACTTAGGTGT TATTGCTGAA AGTGTTTCTT TAAACTTCCA AAAAGTTCAA GAATTCAAAT 5100 

CATCAGTTGT TAATAAATTA ACTGGTGGTG TTGAAAGCTT ACTTAAAGGT AACAAAGTTA 5160 

15 ACATOGTTAA AGGTGAAGCA TATTTCGTAG ATAACAATAG CTTACGTGTT ATGGACGAAA 5220 

AGAGCGCACA AACATACAAC TTTAAAAATG CAATCATTGC AACAGGTTCA AGACCAATTG 5260 

AAATTCCTAA TTTCAAATTC GGTAAACGTG TTATCGACTC AACAGGTGCT TTAAACTTAC 5340 

20 AAGAAGTACC aGGTAAATTA GTTGTAGTTG OTGGAGGATA CATTQGATCA GAATTAGGTA 5400 

CAGCATTTGC TAACTTTGGT TCAGAAGTAA CCATCCTTGA AGGTGCTAAA GATATCTTAG 5460 

GTGGCTTCGA AAAACAAATG ACACAACCTG TTAAAAAAGG TATGAAAGAA AAAGGTGTTG 5S20 

26 AAATCGTTAC TGAAGCTATG GCTAAATCAG CTGAAGAAAC AGATAACGGA GTTAAAGTTA 5580 

CTTATGAAGC TAAAGGCGAA GAGAAAACAA TCGAAGCTGA TTATGTATTA GTAACTGTAG 5640 

GTCGTCGTCC AAACACAGAC GAATTAGGCC TAGAAGAATT AGGTGTTAAA TTCGCTGACC 5700 

30 

GTGGATTATT AGAAGTTGAT AAACAAAGCC GTACGTCTAT CAGCAATATC TATGCAATTG 5760 

GTGATATCGT TCCAGGTTTA CCACTTGCTC ACAAAGCTAG CTATGAAGCT AAAGTTGCTG 5820 

CTGAAGCAAT TGATGGTCAA GCTGCTGAAG TTGATTACAT TGGTATGCCA GCAGTATGCT 5880 

35 

TTACTGAACC AGAATTAGCT ACAGTTGGTT ATTCAGAAGC GCAAGCTAAA GAAGAAGGTT 594 0 

TAGCAATTAA AGCTTCTAAA TTCCCATATG CAGCAAATGG TCGTGCATTA TCATTAGATG 6000 

ATACTAACGG ATTTGTTAAA CTTATTACAC TTAAAGAAGA TGATACTTTA ATCGGTGCTC 6060 

40 

AAGTAGTTGG TACTGGTGCA TCAGATATTA TCTCTGAATT AGGTTTAGCA ATTGAAGCTG 6120 

GTATGAATGC TGAAGATATC GCATTAACAA TCCATGCACA TCCAACATTA GGTGAGATGA 6180 

45 CTATGGAAGC AGCAGAAAAA GCTATCGGAT ACCCAATCCA TACAATGTAA TAACTGATTA 6240 

TCTATAAAGA TTCAGTCATT AAAAGCTGTA GCATATGCTA CGGCTTTTTT GTTTTAGGTA 6300 

AAGTAATGTA AGGAAATTGA TTTGAGATAT CGTTAACATG TGACATGCAT GTTATACTAG 6360 

60 CGATGCTAAT AAAAGAATTG AAATGGAGGG TTCAACAATG GAATATGAGT ATCCAATTGA 6420 

TTTAGACTGG AGTAATGAAG AGATGATTTC AGTGATAAAT TTCTTTAATC ATGTAGAGAA 6480 
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AATTGTGCCT GCTAAAOCAG AGGAAAAACA AATTTTTAAT ACTTTCGAAA AAAGTAGTGG 6600 

CTATAATAGT TACAAAGCAG TTCAAGATGT AAAAACTCAC TCTGAAGAAC AAAOAGTAAC 6660 

AGCTAAAnAA TAATTCGTTC GAAATTAACA CAATTTAATA GGAATTTTTC TTTAAAACTA 6720 

TTGCTAATAA AGCTATATTT TGATACCTTT ATCAAGTGTT AAACAAAATG TTTGATAAAA 6780 

GTAAACTTAA TATAGCTTTT TTAGGTGGAA AAATAAATGA ACATAGGTAA TAAAATTAAA 684 0 

AATCTTAGAA GAATTAAAAA TTTAACGCAA GAAGAACTTG CTGAACGTAC AGACTTATCG 6900 

AAAGGCTACA TTTCACAAAT AGAAAGTGAA CATGCCTCAC CAAGTATGGA AACTTTCTTA 6960 

AATATTATAG AGGTGTTAGG AACGACGCCA AGTGAATTTT TTAAAGACAG TGAAAATGAA 7020 

AAAGTATTAT ACAAGAAGGA AGAACAAGTT ATTTATGATG AGTATGATGA AGGTTATATA 7000 

TTAAATTGGT TAGTTTCAAA GTCAAATGAA TATGATATGG AGCCATTAAT ATTAACTTTA 7140 

AAGCCTGGAG CATCATATAA AAATTTTAAT CCATCAGAGT CTGATACGTT TATTTATTGT 7200 

ATGTCAGGTC AGATAACACT TAATTTAGGC AAAGAGATAT ATCAAGCACA AGAAGAAGAC 7260 

GTTTTGTATT TTAAAGCACG AGATAATCAT CGTTTGTCAA AOGAATCAAA CAATGAAACA 7320 

CGAATACTTA TTGTAGCGAC AGCTTCATAT TTATAGGGGG GATCTTATTT GGAACCGTTA 73 80 

TTATCATTAA AATCAGTTAG TAAAAGCTAT GATGATCTTA ATATCTTAGA TGACATAGAT 744 0 

ATTGATATTG AATCAGGATA CTTTTATACA TTATTAGGTC CTTCAGGTTG TGGTAAAACA 7500 

ACAATTTTAA AATTAATTGC AGGGTTTGAA TATCCTGACA GTGGTGAAGT GATTTATCAA 7560 

AACAAACCAA TTGGTAATTT ACCACCAAAT AAACGTAAAG TGAATACAGT CTTTCAAGAT 7620 

TATGCATTAT TTCCACACTT AAACGTCTAT G AT AAT AT CG CTTTTGGTTT GAAATTAAAA 7680 

AAATTATCAA AAACCGAAAT TGATCAAAAA GTAACTGAGG CATTAAAATT AGTAAAACTT 774 0 

TCAGGTTATG AAAAAAGAAA TATTAATGAA ATGAGTGGCG GACAAAAGCA ACGTGTTGCA 7800 

ATTGCACGTG CTATCGTAAA TGAACCAGAA ATATTATTGT TAGATGAATC TTTATCCGCA 7860 

TTAGATTTGA AATTGCGTAC TGAAATGCAA TATGAATTAC GAGAATTGCa ATCTAGATTA 792 0 

GGtATTACAT TTATATTTGT aACACATGAT CCA 7953 
(2> INFORMATION FOR SEQ ID NO: 153: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 234 7 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND ED NESS : double 

(D) TOPOLOGY: linear 
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GGCGTGATCA TACGACCGTC ATTCATGCTC ATGAAAAAAT ATCTAAAGAT TTAAAAGAAG 60 

ATCCTATTTT TAAACAAGAA GTAGAGAATC TTGAAAAAGA AATAAGAAAT GTATAAOTAG 120 

GAAACTTTGG GAAATGTAAT CTGTTATATA ACAGCACTAA TGATnACAAT CATTTTTTAC 180 

ATTTCTATAT GCTAATGTGG CAAGATGAGC AAAACTCATT TTGTGGATaA TGTTTaAAAG 240 

TCATACACAC CATACACAAG TTATCAACAT GTGTATAAyT cGcCAAATCT ATGTTTTTAA 300 

GACTTATCCA CCAATCCACA GCACCTACTA CTATTACTAA GAACTTAAAA CCTATATAAT 360 

TATATATAAA CGACTGGAAG GAGTTTTAAT TAATGATGGA ATTcACTATT AAAAGAGATT 420 

ATTTTATTAC ACAATTaAAT GACACATTAA AAGCTATTTC ACCAAGaACA ACATTACCTA 480 

TATTAACTGG TATCAAAATC GATGCGAAAG AACATGAAGT TATATTaACT GGTTCAGACT 540 

CTGAAATTTC AATAGAAATC ACTATTCCTA AAACTGTAGA TGGCGAAGAT ATTGTCAATA 600 

20 TTTCAGAAAC AGGCTCAGTA GTACTTCCTG GACGATTCTT TGTTGATATT ATAAAAAAAT 660 

TACCTGGTAA AjGATGTTAAA TTATCTACAA ATGAACAATT CCAGACATTA ATTACATCAG 720 

GTCATTCTGA ATTTAATTTA AGTGGCTTAG ATCCAGATCA ATATCCTTTA TTACCTCAAG 780 

25 TTTCTAGAGA TGACGCAATT CAATTGTCGG TAAAAGTGCT TAAAAACGTG ATTGCACAAA 84 0 

CAAATTTTGC AGTGTCCAcC TCAGAAACAC GCCCAGTACT AACTGGTGTG AACTGGCTTA 900 

TACAAGAAAA TGAATTAATA TGCACAGCGA CTGACTCACA CCGCTTGGCT GTAAGAAAGT 960 

30 TGCAGTTAGA AGATGTTTCT GAAAACAAAA ATGTCATCAT TCCAGGTAAG GCTTTAGCTG 102 0 

AATTAAATAA AATTATGTCT GACAATGAAG AAGACATTGA TATCTTCTTT GCTTCAAACC 1080 

AAGTTTTATT TAAAGTTGGA AATGTGAACT TTATTTCTCG ATTATTAGAA GGACATTATC 114 0 

35 

CTGATACAAC ACGTTTATTC CCTGAAAACT ATGAAATTAA ATTAAGTATA GACAATGGGG 1200 

AGTTTT AT CA TGCGATTGAT CGTGCCTCTT TATTAGCGCG TGAAGGTGGT AATAACGTTA 1260 

TTAAATTAAG TACAGGTGAT GACGTTGTTG AATTGTCTTC TACATCACCA GAAATTGGTA 1320 

40 

CTGTAAAAGA AGAAGTTGAT GCAAACGATG TTGAAGGTGG TAGCCTGAAA ATTTCATTCA 13 BO 

ACTCTAAATA TATGATGGAT GCTTTAAAAG CAATCGATAA TGATGAGGTT GAAGTTGAAT 144 0 

4S TCTTCGGTAC AATGAAACCA TTTATTCTAA AACCAAAAGG TGACGACTCG GTAACGCAAT 1500 

TAATTTTACC AATCAGAACT TACTAAAAAT AAATATAAAT AAAGGATGAC GTGATTAATT .1560 

AAAACGTCAT CCTTTATTTT TTGGCAAAAA TAATTCTAGG TGCGTATGTA AAATAAATTT 1620 

50 GGCAGCATTT TAAACAGCAA ATAAAAGACG CCAATTAAAT TTATGACAAA TGTATCCAAA 1680 

ATTTAATAAG TGTGCTTATA TGCCCTTTAA ATTTAAAATT TTAATAGTCA ATAACAAGTT 174 0 
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AAAAATAAGA ATTAATTATT TATATGTAAA CGGTTTCTAC CTCTATTTTA AATGAAATTT 1860 

GTGACAAAAA AAGOTATAAT ATATTAATGA CATACAAAOA AATGOAGTGA TTATTTTGGT 1920 

TCAAGAAGTT GTAGTAGAAG GAGACATTAA TTTAGGTCAA TTTCTAAAAA CAGAAOGGAT I960 

TATTGAATCT GGTGGTCAAG CAAAATGGTT CTTGCAAGAC GTTGAAGTAT TAATTAATGG 2040 

AGTGCGTGAA ACACGTCGCG GTAAAAAGTT AGAACATCAA GATCGTATAG ATATCCCAGA 2100 

ATTACCTGAA GATGCTGGTT CTTTCTTAAT CATTCATCAA GGTGAACAAT GAAGTTAAAT 2160 

ACACTCCAAT TAGAAAATTA TCGTAACTAT GATGAGGTTA CGTTGAAATG TCATCCTGAC 2220 

GTGAATATC C TCATTGGAGA AAATGCACAA GGGAAAGACA AATTTACTTG GAATCAATTT 2280 

ATACCTTAGC TTTAGCAAAA AGTCATAGAA CGAGTAATGG ATAAGGGACT CCATACCGTT 2340 

TTAATGC 2347 
20 (2) INFORMATION FOR SEQ ID NO: 154: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13542 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
25 (D> TOPOLOGY: linear 
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<Xi> SEQUENCE DESCRIPTION: SEQ ID NO: 154: 

ACAAGACGTn TCTATAACTT ATCTGAAATC GCTCGTCAAG ATAAAGATTA TGCAACTATC 60 

TCATTCTTAA ACTGGTTCTT AGATGAACAA GTCGAAGAAG AATCAATGTT TGAAACTCAC 120 

ATCAATTATT TAACTCGTAT CGGCGATGAC AGCAATGCAT TATATCTTTA CGAAAAAGAA 180 

CTTGGCGCTC GTACATTCGA CGAAGAATAA TTAAACATCA CTACAATAGA CAGATAAATA 240 

TCATACGACA TGATAGGCAT TTGGGTCACT TACAATAACC CAATGTCTAT ATTATTTTGC 300 

TTTACGGAGA TCACTAGATT CATTTTCTGA ATCATTGATC TGCGTTTTTT CATTTTCAAG 360 

GCTAATTATT GTATTTTTAG TCATTTATTT TTTAAACTAC TAATGTTAAT AACTCTAAAT 420 

TTGATGTTGA ATTAATTTGA CGATTTTAAA GCATATCATC ATTTACTTTT TAATCAGAGT 48 0 

45 TACATCCAAA TGATAGATTT CACGTTATAC CTTCACGTAT AATATTATGT ATCGTTTGTA 54 0 

AGCAAATGAC TAAAAGTCTA TTAATATATA CATTTAATTA ATTGAAAGGA TTGACTACAT 600 

GATACAAGAT GCGTTTGTTG CACTTGATTT TGAAACAGCA AATGGTAAAC GTACAAGTAT 660 

SO TTGTTCTGTC GGAATGGTTA AAGTCATTGA TAGTCAAATA ACAGAAACAT TTCATACTCT 720 

TGTGAATCCG CAAGACTATT TTTCACAACA AAATATTAAA ATTCATGGCA TACAACCAGA 780 
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aGATTTACCT GTTGTCGCAC ATAACGCGGC ATTTGATATG AACGTCTTAC ATCAAAGCAT 900 

TCAAAATATT GGTTTACCAA CTCCAAATTT AACTTACTTT TGTAGTTATC AACTTGCTAA 960 

AAGAACCGTT GATTCGTATC GATACGGTTT AAAACATATG ATGGAGTTTT ATCAATTAGA 1020 

TTTTCATGGT CATCATGATG CATTGAATGA TGCCAAAGCA TGCGCAATGA TTACTTTTAG 1060 

GCTACTGAAA AATTATGAAA ATTTAACATA TGTAACTAAT ATTTATGGTA AAAATCTAAA 114 0 

AGATAAAGGC TAGGACTAAA TAAAATACTC CCTTCAAAAG TAAGCATTGT AAAAATGTAA 1200 

ACTTTGCAGG GAGCTTTATT TTATATAAAG TCATATATCG TCATATTTTT ATAAGTTGAT 1260 

TGTTCTAAAT TACCTACAGT GACACCAATA AGTCGAATTG GTACATCAGG GTCTTTTAAA 1320 

TCGTTATAAA GTAAATATGC AATATTATAA ATATCTTCTT CAGAACTAAC CGAATCTCTT 1360 

AAACTCATCT GTTTAGATAG CGTTTCAAAT TGATAAGTTT TAATTTTAAC CGTTACAGTT 1440 

20 TTAGCTGACT TCTGTAATTT ATTTAGACGT TCAGCTGTTT TACCTGnACA ATTCCCATAC 1500 

TTTTCTTAAA ATCTCTTCAT CATCATTCAC GTCTGTTGCA AATGTGCGTT CAGTCCCTAC 1560 

TGATTTTCTT ACTCTTGATG ATTTCACTTC ACTATGGTCA ATACCGCGTG CCTTGTTATA 1620 
25 TAAACCCCGA CCTCTTTTTC CAAACAAACG TATTAATTCA AATTCCGTTT TCTCATATAA - 1680 

ATCTCTACCG TTAAAAATAC CATTATCATG CATTACTTTT TTGGAAGCTT TACCTACGCC 1740 

TGGaAAATCT CCAATATCCA ATGTCATCAA AATATCATGG aCATTTTGAT AATCAATCAC 1600 

30 AGTCATACCA TCAGGTTTAT TCATACCACT CGCTAATTTA GCTAAAAATT TGTTATAAGA 186 0 

AACACCTGCA GATGCTGTTA AATGTGTCTG CTCTAGAATA TCTTTTCTAA TATACTGAGC 1920 

AATTTTCGAA GCAGGAAGGT CTGGTCTCAC TAATTCTGTA ATATCTAAAT ACGCTTCATC 1980 

CAATGACATC GGTTCTACCT TATCTGTATA ACTTCGGAAA ATAGACATAA TCTGCGCAGA 2040 

TGTTTCTCGG TAAGCACCAA AATTACTTGT GACAAAGTAT CCATTTGGAC ATAATTTATG 2100 

CGCTTGTGAC ATAGGCATTG CTGAATGGAC GCCGTATTTT CGTGCTTCAT AGGATGCCGT 2160 

AGAGACAACA CCCCTACTGC TTGCTTTACC ACCAACAATG ACTGGTTTCC CTTTCAATTT 2220 

GGGGTTATCT CTCATTTCGA CTTGTGCAAA AAAATAGTCC ATATCTATAT GAATAATTCG 2280 

TCTCTCAGTC AAGTGCTCAC CTCCCTACTA ATTTTTACTT TTATAACGCA CAAAAATATC 2340 

TCAACATAAT TATACGCTGT GTACGATTTT TTTACATAAA TCTTGCACTT AGCGATAACT 24 00 

ATATTGaGAT AACTACAAGT TGTTATaAAA TCAATTGCTA TTTAAGCATG ATGATGAAGA 2460 

SO . CGATTGAGTA AGAAAACATA GGTAATCTGA AATAATTCAA GCAAATTCAT TTTGTTGGTA 2S20 

TCATCATATT AAAATTTATT ATTGAGTCGG CTTTTGATGA TACAAATAAA TACTATCTTC 2580 
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AAAGCAATAA GCGGTATGCA TACTAAACAT AAAAATAAGT GATGAATAAC CAAATACCTT 2700 

AATTAAAATA AGCAAGCCAG TACTTAATAG GATTAGTGGT GACAGCATAA TAATTGAGAA 2760 

5 TTGCCATTTG TTOAAGCAAG CATCTGCTGT TTGGAATAAG ATTCTGTCTT TTTTTATATT 2820 

AAACATAGGT TTGCTATCTT TTTTAAATAA AAGAAATAAT GCTCTATGGA TAAGTTCATG 2880 

TAAAATCAAT AAAATAATGA ATCCAGCAAA CCCATATACA AGATTGATGA TGATATTTTG 2 94 0 

10 

ATCGACAACC GCTGTGACAC CTAACGCCCA CTTATACGTA AATAAAATCA CGAATAACGC 3 000 

AATAACAAGT TGCAAGATAA TAAACCTTCG CATTTGAAAA TTATTTGTCG TTAAATCAAT 3060 

1S TTTATGCATT ACCAACCCTC CCGATCATGA CATTCTTATT CTTCTTTAAA TATAGTATAC 3120 

AATGTCACAT TTAATTTAAA AAGTTCATAT CAAGAAAGTA AATTGGCTGT AATAAAATTT 3180 

TAATATACGA LTTITTTCTT CACTTATTAA GGCGAAATTT TATCtCAAAT CATGTGCGCT 3240 

20 ATTTCAAATT GAATAATGCC ACTGTCTCAA CATGTGTTGT TTGTGGAAAC ATATCTACCG 3300 

GTGTTACCTC TTCAAGTTGA TATTTTTCAG CTAATAATAA TGCATCACGT TGCTGTGTTG 3360 

CGGGATTACA TGAAATATAG ACAATACGCT TAGGTTCTAA TGTAAGCAAA GTCTGAATAA 3420 

2$ ACGTTTCGTC ACAGCCCTTT CTTGGCGGAT CAACCATTAC AACATCTGGT TTAATCCCTT 34 80 

GTGCTTTCCA TTGTAAAATA ACTTCTTCAG CTTTCCCACA GACAAAAGTT GTATTATTGC 354 0 

ATTGGTTTAT AGTCGCATTT TGTTGTGCGT CTTCAATTGC AGAAGGTACT ACTTCAACAC 3 600 

30 

CGTATACATG TTTTGCAAGT GGTGCCATAT ATAGCCCTAT TGTTCCAATA CCACAATAGG 3660 

TATCTAATAC AACTTCATTA CCTGTCAATT GCGCATACTC AATTGCTTTA TTATATAATT 3720 

TCTCTGTTTG TTCAGAATTA ATTTGGTAGA ATGACTGATC ACTTATTTTA AATGTACTAT 378 0 

CTGTTAATTG ATCAATAATT GTATCTTTAC CATATAGCGT TATAGATTGA CGTCCCATAA 3 84 0 

TAACATTAGA GTGGCTATCA TTAATGTTTT GTTTAATGCT TGTCACATTA GGAAATGCAT 3900 

CTAATATCTT CTCAACAACA GCATTTTTTT GTGGCCACTT TTTACCATTA GTTACAAAAA 396 0 

40 

TAATCATCAT TTCGTCTGTA TGATATCCTG TTCTTACAAC CAAATGTCTC ATTAAACCTT 4 02 0 

TTTTCAATTG TTCTTGATAA ATACTTACAT TTAAATCTTT TAAAATAGAT TTAACTTCAT 4080 

45 TCATCACTTC TTGATGTTGT GAATCTTGTA TTAAACAACT TTCCATGTCA ATAATGTCAT 414 0 

GG CT TCTTTG ACGATAAAAG CCCATAATAA CTTCATTCTG TTCATTCTTA CCAACTGGAA 4200 

TCTGGGACTT GTTTCGATAT CTCCAAGGAT CTGTCATGCC AACTGTATCG TTAATCTTAG 4260 

50 AATTATCAAA ATGCGCTTTT CGCTGAAACA AATTAATCAC TTGTTCCTTT TTCATTTCAA 4320 

GTTGTGCTTC GTATGATAAG TGTTGAAGTT GGCACCCACC ACAACGTTCA TAATATATAC 4380 
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AGTTCTTTTT TACTTTGATA ATTTTATATT CAATTTGTTC ATTAATTAAA GCTTGTGGTA 4500 

TGAAAATAOG AAAGCGATCT ATTTTTACGA CACCATGGCC TTCATGCGTT AAATCAACAA 4560 

5 CTGTTCCCGT TTTTATGTCA TTTTTAGCTA TTGCTTGCAA AATTTTACCT CCAAAATGAA 4620 

CAGGTTAGGA ACAAAATTAT GCGCTTCCTA ACCTGCCATT ATATATTTCA CTATTTCTGT 4680 

TTATTCTTCG ATTAAATTGT CATCAACATG ATCATTATTT ATTAACTCTT CATTTACAAT 4740 

10 

ATCATTAGGT GCAAAGACAT CTATATGACG TTCTAGATTT AAGAAATTCG CTGGTAATTT 4800 

ACCACCATAT TCTCCATCTA CATTTAGTTG TAAGTCTGTG AATGATGAAA TATTAATTGC 4860 

CTTTGCTTTT TCATAAATAA CTTTAGGATG CTTAGTATGT TCTCCTCTTG AAGCTAAAGT 4920 

1S 

CATAATATGA CCAAGTTCTG CAAGGTTTGA TTTTTCAACT ATAATTAACG TAAAATAGCC 4980 

GTCATCTAAC TTAGCGTCCG GCACTAATTT TTCAAATCCT GCCATTGAAT TTGTTAAACC 5040 

20 TAAAAAGAAT AATAATGCTT CTCCTTGGAA AACATTACCA TCATATTCAA TTCTTAAATC 5100 

TACAG CTTTC ATTTGAGGTA ACATTTCGAA ACCTTTGaTG TAATAAGCAA ATGGACCAAC 5160 

AATAGATTTC AATTTACTCG GTGTTTCATA AGAGACTTGC GTCAATTGTC CGCCTGCAGC 5220 

25 TAAATTAATA AAGTATCGAT TATTCATTTT ACCAATATCT ACTTTAGTAG AATGACCTTC 5280 

AATGATGACA TCAAGTGCCC CCATGATGTC ATTAGGTATA TGCAATGCAC GTCCAAAGTC 534 0 

ATTAACAGTA CCCATAGGAA TGACACCTAG CTTAGGACGA TTAGGCTTTT CTGCGATACC 54 00 

30 ATTAACTACT TCATTTAATG TTCCATCACC ACCTGCAGCG . ATTAATACAT . CATAATTTTC 54 60 

ATG CATAGCT CTTTCTGCTT CAAGTGTGGC ATCACCTATT TTCTCGGTTG CATATGCACT 5520 

CGTTTCATAT CCCGCTTTTT CTAATTTTAT TAAGGCATCA GGTAATTCTC TTTTAAATAG 5580 

35 

CTCTTTACCT GATGTCGGGT TATAAATGAT TCTAGCACGT TTCCTCATAT CTTATCCCTC 5640 

TACTTAAAAT TCATATATTT TAACTTCATC TTTGTTTCGT CTAATAGGGA GTGGGACAGA 5700 

AATAATATTT AACAAAATTT ATTTCGTTCT ACCCCAACTT GCATTGTCTG TAGAATTTCC 5760 

40 

TTTCGAAATT CTCTATGTTG GGGCCCCACC CCAACTTGCA CATTATTGtA AGcTGACAGA 5820 

AAGTCAGCTT CTTTGTTTGG GGGCCCCGCC AACTTGCACA TTATTGTAAG CTGACAGAAA 5880 

45 ATCAGCTTCT ATGTTGGGGC CCCACTAGAA TTGAAAAAAG CTTGTTACAA GCGTATTTTC 5940 

TTTCAGTCAA CTACAGCCAA TATAACATTG TAGTGCCTAG GACATTGAAT TTATGACCCA 6000 

GGCTCAGTCT TATTTCATCA TTCTTAATAT CGTTAAAGAC CAACTTGTAT CTTAAACAAA 6060 

SO TACTATCTCA ATATGTACAA AGCTTGTTAT TTATTCAGCA TTTTTTGCCG TTCTTCATTA 6120 

TAtAGcTTCG TCAGTTATGC TATTTTACCT TTAAAATGAT GTTGTAAATA TAATGTTGTC 6180 
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AACGCATTAA TAAAATTAAT ATTTTTACCA TTAACATGTA CAATGAATAA AGTTAAAAGT 6300 

AATTTQACTT CTATAGATAT AAATAAACCC TCQATTGCAT CTAAGTCAGC AATCAAGGGT 63 60 

TTATTTTTTA AATCTTCATA GTTTGATGAT TTAAATTATC TTTTATCTAA TTCTTGTTTT 6420 

AATAGTTGAT TTACTAATTG TGGATTAGCT TGACCTTTAG ACGCTTTCAT AATTTGACCA 64 80 

ACTAAGAAGC CCATAGCTTT GCCTTTACCA TTTTTGTAAT CTTCAACTGA TTGTTCGTTA 654 0 

TTGTCTAATG CTTCATTTAC AAATTTTAGA AGTGTTGCTT CATCAGAAAT TTGAACTAAG 6600 

CCATTATCTT CCATAATCTG TTTAGCATTA CCACCTTTAG CTGCTAACTC TGGGAAGACT 6660 

TTCTTCGCAA TTTTACTGCT CATTGTTCCG TCTTCGATAA GTTTAATCAT ACCTGCTAAA 6720 

TTTTCTGGTG TTAATTTAGT ATCTAATAAT TCTACTTGAT TTTTATTTAA ATATTCGTTT 6780 

ACGCCACCCA TTAACCAGTT AGATGTTAAT TTAACATCTG CACCGTGTTC AATTGTTGAT 684 0 

20 TCAAAGAAAT CTGACATTTC TTTAGTCAAT GTTAATACGT GTGCATCGTA TGCAGGTAAA 6 900 

CCTAATTCAT TTACATACTT AGCTTTACGT TCATCTGGTA ATTCAGGAAT TGTCTGACGA 6960 

ACACGCTCTT TCCAAGCATC ATCAATATAT AAAGGTACAA TGTCAGGCTC TOGGAAGTAA 7020 

25 CGGTAATCAT CAGAACCTTC TTTAACACGC ATTAAAATTG TTTTACCTGT AGATTCATCA 7080 

AATCGACGTG TTTCTTGTCC GATTTCTCCA CCATTTAACA ATTCTTCTTC TTGGCGTTTT 714 0 

TCTTCATATT CTAAACCTTT ACGTACATAG TTAAATGAGT TTAAGTTTTT CAATTCGGCT 720 0 

TTAGTACCAA ATTTTTCTTG ACCATATGGA CGTAAAGAGA TGTTAGCATC ACAACGTAAA 7 26 0 

GATCCCTCTT CCATCTTAAC GTCTGATACA CCAGTGTATT GAATAATTGA ACGCAATTTT 7320 

TCTAAATATG CATATGCTTC TTTAGGTGAA CGAATATCTG GTTCAGATAC GATTTCAATT 73 8 0 

AGCGGTGTAC CTTGACGGTT CAAGTCAACT AATGAATACT CACCTTTATG TGTTGACTTA 744 0 

CCAGCATCTT CTTCCATGTG AAGACGAGTA ATACCGATTC GTTTTGTTTC ACCGTCGACT 7500 

TCGATATCGA TATATCCATT TTCACCAATT GGTTGATCAA ATTGAGAAAT TTGATATGCT 756 0 

40 

TTTGGATTAT CTGGATAGAA ATAGTTCTTA CGGTCAAACT TAGATTCTGT TGCGATTTCC 7620 

ATATTTAGTG CCATTGCAGC ACGCATTGCC CAGTCTACTG CACGCTTATT AACAACTGGT 7680 

4$ AAGACACCTG GATATGCTAA GTCGATAACA TTTGTATTTG AGTTAGGTTC TGCTCCAAAA 774 0 

TGCGCTGGTG ATGGAGAAAA CATTTTTGAG TCCGTTTTTA ACTCTACGTG AACTTCAAGT 7800 

CCTATAACTG TTTCAAAATG CATGATTTCC ACTCCTTATA ATTTTT CAT A AACGTCATGT 7860 

50 AAATTGTATT GTGTTTCATA TTGATAAGCG ACACGATATA ACGTTTTTTC ATCGAATGGT 7920 

TTACCAATGA ACTGTAAACC GATTGGTCGG CCATTTGATT GTCCACAAGG AACAGAAATA 7 980 
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GGATCATCAA TTTCTTCACC TAAATTAAAC GCaGTgTnAG GCGCTGTTGG 


ACCAACTACT 


8100 




ACATCATAAT 


TTTCGAATAC 


TTTATCAAAG 


TCATTTTTAA 


TCAATGTTCT 


AAtl 11 IxviA 


8160 


5 


GATTTTTTAT 


AGTAAGCATC 


ATAGTAACCT 


GAACTTAATG 


CAAATGTACC 


TAAGAAAATA 


8220 




CGACGTTTTA 


CTTCTTTACC 


GAAACCTTCA 


GATCTTGACA 


TTTTATATAA 


TTCTTCTAAT 


8280 


10 


GAATGAGCTT 


CTTTAGAATG 


ATAACCATAA 


CGAATTCCGT 


CAAAACGAGA 


AAGGTTTGAC 


8340 


GAAGCTTCTG 


ATGATGCAAT 


CACGTAATAT 


GATGGAATAC 


CAAATTTAGT 


ATTTGGCAAT 


8400 




GAT ACTTC CT 


CAACGACAGC 


ACCTAAAGAT 


TTTAAAGTTT 


CTACAGCGTT 


TTGAACTGCT 


6460 


15 


TCTTTTACGT 


CATCAGCTAC 


ACCTTCACCT 


AAGTATTCTT 


TAGGTAATGC 


AACTTTTAAT 


8520 




CCTTTAATAT 


CTTTACCAAT 


TTCAGATGTA 


AAGTCTACAT 


CATCAACTGG 


TGCACTTGTA 


8580 




RAjGTCATTAA 


CATCTGCACC 


AjGAAATAGHT 


TCTAATAOGA 


x lowti inx v 


TTTTACATTT 


8640 


20 


OGAGTCAATG 


GACCAATTTG 


GTCTAATGAA 


6ATGCAAAAG 




AAATCGAGAT 


8700 








f r ATAr , r , f5Ar , A 


a mrrarAAT 

nVfUuwiUnn X 




TTGTCTAATT 


8760 






A V> X V— X VJnnLV* 


X nnVJv. X n/iK X 


nrtTAfTA acir 




TGCTGCTGCA 


8820 


25 




it 1 wiA^ Ui^W 




X lAluulUui 


A±\j\iV»x 1AAC 


TGTTTTTTTG 


8680 




AAATAArtA*m 


X 1 X V_ X X X \Jn 


>\v_.V_M.\_l_v_>\ X X 




LL/iliil X Inn 


TTTACCGATT 


8940 




AAAACGGCAT 


TTTCATTATG 


TAGTTTTTCC 


A*n*Ar , a.f3T , Af3 


ATTTYJTAA AT 
aX xLUXnnnl 


TGGCACAAAA 


9000 


30 


CCTTCTAACA 


TTTTACTTGC 


ACATGTTGTT 


TV*T A ATPCV3T 
X V— X nn X v_v^va X 


X XVaXnnXnnX 


GTTATCTTTT 


9060 




ATACCCATTG 


GAATACCAAA 


TAATTTGCCA 


("•ATTTttAT 


CTTTTfirTlY? 

%r X X X X WW X X >J 


TAATTCATCC 


9120 


35 


AATTCTTGCG 


CTTTTTTGAT 


TG CATTTTCT 


TTATCCAGCG 


CTAGAAAAGA 


CTTAATTGTT 


9180 


GGATCAGTCT 


CTTCAATTGC 


ATCATATATA 


XCTTTAACAA 


CATCAGATGG 


TTTGATTTTT 


9240 




nyi'cmTA ttaaagttaa taaattctca 


ACCGATTCGT 


AGCGAATGCT 


CATCTTACGC 


9300 


40 


GTCCTCCTCA 


TTCATGATTG 


TAGGCACTTT 


AAATTGTCCA 


TCTTCTGTTT 


CTTTGGCATT 


9360 


TTTCAAAGCT 


AATTCTTGTG 


GAATACCTTT 


AATTGCTTTA 


TCTTCACGTA 


AAACGTTTTG 


9420 




TAAATCTAAA 


ACGTGATATG 


TAGGTTCAAC 


GCCTTCTGTA 


TCAGCGCTAT 


CATmvm' 


9480 


45 


TGCAAAATCT 


AAAATGCTTT 


CTAATGTGTT 


GGCCATTTCT 


TCCGTTTCTT 


CAGGAGAAAT 


9540 




ttgaagtctt 


GCAAGATTCG 


CGATATGCTC 


AACTTCTTCA 


CGTGTTACTT 


TTGTCATTAA 


9600 




taaaagcctc 


CTTTAAGTCA 


TTCATCACTA 


AATTGTATCA 


AATTTCCAAT 


TAAAAATCTA 


9660 


60 


agtatttatg 


AGGTGCTACT 


TTAATTTCAT 


ATAAACTGTA 


TAAACATTAT 


CATTCGTTTA 


9720 




TCAAATCATT 


TTTTATGAAA 


ACAACACTCT 


TTTAATATTA 


GACAACCCAA 


TTCAATATTA 


9780 



55 



781 



EP0 786 519 A2 





TATATTGGTA 


TGCAAGTATT 


TCAAAAAGAA 


TAAATTTAAT 


TTTCCTACTT 


TTCTAAACAT 


9900 




TTATCTTTAT 


GTATAATGTT 


TTCAAGTAAC 


TAAATTATAA 


ATTAAATAAA 


GGGAGTGTTT 


9960 


5 


ATCATGCTTA 


CAATGGGGAC 


AGCATTAAGT 


CAACAAGTAG 


ATGCCAATTG 


GCAAACTTAT 


10020 




ATTATGATTG 


CCGTCTACTT 


CTTGATACTA 


ATCGTTATTG 


GCTTTTACGG 


TTACAAGCAA 


10080 


10 


GCAACTGGTA 


ACCTAAGCGA 


GTACATGTTA 


GGTGGACGTA 


tATTGGACCG 


TATATTACTG 


10140 


CATTATCAGC 


TGGAGCTTCA 


GATATGAGTG 


GATGGATGAT 


TATGGGGCTA 


CCTGGTTCTG 


10200 




TCTATAGCAC 


TGGTCTATCA 


GCTATGTGGA 


TTACAATCGG 


TTTAACATTA 


GGTGCTTATA 


10260 


15 


TAAATTACTT 


TGTTGTTGCT 


CCTAGACTTC 


GTGTTTATAC 


CGAATTAGCT 


GGAGATGCAA 


10320 




TTACATTACC 


AGATTTCTTT 


AAAAATCGTT 


TAAACGATAA AAATAATGTG 


TTAAAGATTA 


10380 




TTTCTGGATT 


GATTATCGTA 


GTATTCTTTA 


CATTATATAC 


ACATTCTGGT 


TTCGTATCTG 


10440 


20 


GTGGTAAACT 


ATTTGAAAGT 


GCTTTTGGAT 


TAGATTATCA 


TTTCGGTTTA 


ATATTAGTTG 


10500 




CTTTCATTGT 


CATTTTCTAT 


ACTTTCTTTG 


GTGGATATTT 


AGCTGTATCA 


ATTACAGATT 


10560 




TCTTCCAAGG 


TGTCATTATG 


TTAATTGCGA 


TGGTTATGGT 


CCCTATTGTT 


GCTATGATGA 


10620 


25 


ATTTAAACGG 


CTGGGGAACG 


TTTCATGATG 


TAGCAGCTAT 


GAAACCTACA 


AATTTAAATT 


10680 




TATTTAAAGG 


GTTATCATTT 


ATAGGAATTA 


TCTCTCTATT 


TTCATGGGGA 


TTAGGTTATT 


10740 




TCGGTCAACC 


T CAT AT CATT 


GTAAGGTTTA 


TGTCTATTAA 


ATCACACAAG 


ATG CTACCTA 


10800 


30 


AAGCTAGACG 


TTTAGGTATT 


AGCTGGATGG 


CTGTTGGTTT 


ATTAGGCGCT 


GTGGCTGTTG 


10860 




GTTTAACAGG 


TATTGCATTC 


GTACCTGCTT 


ATCATATTAA 


ACTAGAAGAT 


CCTGAGACAT 


10920 


35 


TATTGATCGT 


GATGAGTCAA 


GTACTCTTCC 


ATCCTCTTGT 


AGGTGGTTTC 


TTACTTGCTG 


10980 


CGATTCTAGC 


TGCAATTATG 


AG CACGATTT 


CTTCACAATT 


ACTTGTAACA 


TCTAGTTCAC 


11040 




TAACGGAAGA CTTTTATAAA TTAATTCGTG GTGAAGAAAA AGCTAAAACG 


CACCAAAAAG 


11100 


40 


AATTTGTTAT 


GATTGGAAGA 


TTATCTGTAT 


TAGTTGTAGC 


AATTGTTGCC 


ATCGCGATTG 


11160 


CATGGAATCC 


AAACGACACA 


ATTCTAAACT 


TAGTAGGTAA 


CGCTTGGGCC 


GGATTTGGTG 


11220 




CATCGTTCAG 


TCCACTTGTG 


CTATTTG CAC 


TTTACTGGAA 


AGGTTTGACA 


CGTGCCGGTG 


11280 


45 


CTGTAAGTGG 


AATGGTTTCA 


GGTGCCTTAG 


TCGTTATCGT 


TTGGATTGCA 


TGGATTAAAC 


11340 




CATTGGCACA 


TATCAACGAA 


ATATTCGGCT 


TATATGAAAT 


TATTCCTGGA 


TTTATTGTAA 


11400 




GTGTAATCGT 


TACATATGTT 


GTAAGTAAAC 


TTACTAAAAA 


ACCTGGTGCA 


TTTGTTGAAA 


11460 


60 


CTGACTTAAA 


CAAAGTTCGT 


GACATCGTTA 


GAGAAAAATA 


ATTCATAAGT 


CTTAACAAAT 


11520 




TAAAAAGGTA 


CTAATGTTAA 


TCAAAATTAT 


GACTAACATT 


GGTACCTTTT 


TATTATCTTT 


115B0 
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AATTAAAGCA 


CGTGGTTGGT 


TACCATCTTT 


AATACGAATT 


TCATAGTTAT 


CGATTTTATC 


11700 




GAAATATTTA 


TTCGCTTGTT 


CAGTAACGTA 


CTGTGTAATA 


CCAATTGTTT 


CAGCTTGTCC 


11760 


5 


ATAGTAATCG 


ATTGGTAAAT 


CTACTACTAA 


TCGTTGTGGC 


TTTTTATCAA 


CAAATTTAAC 


11620 




TTTCCCTACT GCTTGTGTGA AATTAGAAAA ATATGATTGC AAATTATCAT TAAATTGCTT 


11860 


10 


GAAATTATTA 


TTTAAATTTT 


CATCATAATC 


TGCTGCTGTT 


GAAGAAGGTA 


ATAAAGCTGA 


11940 


TTTTTCATTG 


ATATTATGCC 


ATTCATTAAG 


CmXilTlUA 


CTCTTTTCTG 


CAGTCGCTTG 


12000 




AGTGATAAAT 


TCACCTGGTG 


TGATTGAATC 


TTCACTTGAT 


TGCTTATAAA 


TTGCAAAATG 


12060 


1£ 


AATTGGTATA 


TCTTTTAAAT 


CATCATTTTC 


AOGTAACCTT 


GATAATATCT 


CACTAGCCAT 


12120 




TTGTTTACCT 


TGCTTTTTAA 


CTcGCTATCA 


TCTAGTTTTT 


TACTAAAAGT 


CGATCCATCT 


12180 






TATAGTAATA AACACTATTC 


ATAGCTAAAC 


CAATCGTCAT 


AC CTTTAATA 


12240 


20 


ttcttacctt 


TTGTATCTCC 


ACCACCATAA 


AAATCTTGCT 


CTAAAATGTT 


AGATAAATAG 


12300 




GCTGGTGATT 


TTTCTGCAAT 


CTTTTCAGGA 


TCTGTTTCAC 


CTtCGTGTGA 


TGGATTAAGT 


12360 




CCTAAATTTT 


CATTCGCTTT 


CTTGTCTTTT 


TTATCTTTTT 


CAGACATTTT 


ATCGATTTCA 


12420 


25 


CGTTTTGTAT 


ACTTAGGATT 


TAAATAGGCA 


TTAATTGTTT 


TCTTGTCCAA 


AAATTGACCA 


12480 




TCTTGATACA 


AATATTTATC 


TGTTGGAAAT 


ACTTCTTTAC 


TTAAGTTCAA 


TAAACCATCT 


12540 




TCAAAGTCGC 


CGCCATTATA 


ACTATTTGCC 


ATGTTATCTT 


GTAAAAGTCC 


TCTTGCCTGG 


12600 


30 


CTTTCTTTAA 


ATGGTAACAA 


TGTACGATAG 


TTATCACCTT 


GTACATTTTT 


ATCCGTTGCA 


12660 




ATTTCTTTTA 


CTTGATTTGA 


ACTATTGTTA 


TGTTTTTGAT 


TATCTTTTCC 


AGCCTGGTCA 


12720 


35 


TCCTTATGGT 


TACCACAAGC 


AGCGAGTATA 


AAGATAGCTG 


TAATCAATAA 


TACTAATGTA 


12780 


CGCTTCATCG 


ACATACCCCT 


CTAACTATTT 


AATTCATTTT GCTTATCTAC . 


AAATTGTTGC 


12840 




TCTGTCCAAA 


TTTCAATACC 


TAAACTTTGT 


GCTTTTGTTA 


ATTTTGAACC 




12900 


40 


CCAGCAATAA 


CGACATCTGT 


ATTTTTAGTA 


ACGCTACTTG 


TAACTTTAGC 


ACCTTGTGAT 


12960 


GCAAGCCATT 


TAGATGCTTC 


ATTGCGTGTC 


ATTTGATGTA 


GCTTACCAGT 


CAGTACTATC 


13020 




GTTTTACCAC 


TAAATTCAGG 


ATGTCCTTCA 


ATATCTGATG 


TTTTGATACC 


TTTATAAATC 


13080 


45 


ATATTAACAT 


GTTTATCTTT 


TAATTTTTGA 


ATTAAAGCAC 


GAATATCTTC 


ATTTTCTAAA 


13140 




TAAGTAACTA 


CAGATTGTGC 


TACTTTATCA 


CCTATATCAT 


GAATTTCTAC 


TAATTCCGCT 


13200 




TCAGTTACCG 


TTAGTAATCG 


ATCTATCGTT 


TCATATTTTT 


CTGCTAACAC 


TTGGCTCGCT 


13260 


50 


TTAACACCTA 


AATGCCTAAT 


ACCTAGACCA 


AATAATAAAT 


TTTCTAAAGA 


GTTGTCCTTA 


13320 




GCTTGTTGAA 


TGGCAGCTAA 


TAAATTATCA 


ACTTTTTTCT 


GCCCCATTCT 


GTCTAAAGGT 


13380 
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TAAAGCTGTT GAATAATTTT AGTGCCTAAA CCATCAATAT TcATGGCTTG TCTTGaTACA 13500 
AAGTGnATCa ATCCtTcAAC AAGTTGTGCT TGGTCATTTT GG 13542 
5 (2) INFORMATION FOR SEQ ID NO: 155: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: IB 93 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 155: 





CAGTAAACAC 


CTCTGATTAC 


GAATATTTAT 


ACATTTATTT 


TAACACATGC 


ACTGATTTAC 


60 




GACTACTAAA 


CACCTTTACG 


TAAAAAGGGT 


AAACATGGTT 


TATCTATCTT 


GGTTATCTAT 


120 


20 


TTATAAATAT 


TTnTCATATT 


ACGCATAACA 


ATTGCTTAAA 


ATATGTATAA AAATGAATAT 


180 




ATGTGTAATA 


AACTTGCTAA 


TTATTAGATT 


TAATAAGCGT 


CAATTGTTTG 


AACATATTtA 


240 




ATTAAAATCA 


CATTGATATC 


ACAGATACGA 


ATATTGTCGT 


ATAOAAATTG 


AAAATTCTAT 


300 


26 


TTTTTAAATG 


AAAGTCTTCA 


ACATAATTTT 


AAGTTTCAAC 


ATGAGAAAAA 


TCGATTAACA 


360 




AACAACGTCA 


GTTGAATATG 


CCTTTTGAGA 


CATTTCAAAC 


TTTACAATTG 


TTGCTAATCG 


4 20 




ATATATTTGC 


TTTTAGTGAT 


CC CTGCTATA 


AAATAAATCA 


ACGATTTCTA 


ATAAGTGTTT 


480 


30 


TGTATTGAAT 


TGTTCATCAA 


TTTGCGTTAG 


TTCATCCACT 


GCTGCGTCTC 


TATGATAAGT 


54 0 




CAATTTATCT 


TCTGCGCCAT 


CTTTCCCTAA 


TAAACTCACG 


TACGTACTTT 


TATTATTTTC 


600 


35 


AAGATCGCTG 


CCCACTTTTT 


TACCTAACTT 


TGCTTCATCA 


CCATAGCAGT 


CTAATAAATC 


660 


ATCTTTAATC 


TGGAACATCA 


TACCTAAATG 


ATAACTATAA 


CTTTCTAAAT 


GTTCTTTAGT 


720 




tgtStcatcg ACATTAGCGA 


TATCTGCTGC 


ACTCATAACC 


GCAAAAGTTA 


ATAATGCTCC 


780 


40 


TGTTTTTGTT 


TTGTGTATCA 


TTTCCAAAGT 


TTCAAGATCA 


ATTGGTTGGC 


CTTCGCTTTG 


840 


CATATCTAAC 


ATTTGACCGC 


CGACCATTCC 


AACATGACCA 


CTTGCTATTG 


ACAGCCGTTG 


900 




TAGAACTTTT 


ATTTTTACTT 


CATCAGTTAA 


TCTATCATCA 


CTTGAAATAA 


GTTCAAATGC 


960 


46 


TTTAGTTAAT 


AAAGCATCAC 


CTGCTAATAT 


CGCAGTCCAC 


TCACCATATA 


CTTTATGATT 


1020 




TGTTAATTTT 


CCTCGTCGAT 


AATCATCATT 


ATCCATCGCT 


GGTAGGTCAT 


CATGAATAAG 


1080 




TGAATATGTA 


TGAATCATTT 


CTAGTGCAAT 


TGCGCTCTTC 


ATACCTAACT 


CATACTCGGT 


1140 


50 


ATTTAGTGAA 


TCTAAAGTGA 


GTAATAACAG 


AACTGGTCGG 


ATGCGTTTAC 


CTCCAGCATT 


1200 




TAATGAATAC 


AACATACTTT 


CTTCTAGCTG 


AGTATCCATT 


ACTGATTTAT 


TTATCGCAAC 


1260 
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CATCCTCAGC TTCTTCTTTT ATTAAQTCAT TCACCTTTTT TTCGGCATTT TTTAAAGTTG 13 80 

TGTCACAAGC TGCTGATAGT TTCATACCAC GTTGATATAA ATCTAATGAT TCCTCTAAAG 1440 

5 ATACTGTTTC ATTATCTAAT TTTTGAACAA TTTGCTCTAA TTCTTGCATC ATTTCTTCAA 1500 

AACTTTGCGT TTCTTTAGTC ATTATTACAC CTTACTTTCG TAACTTTTGC ATCTACTAAG 1560 

CCATCTTTCA TTGTTAACGT CAATTGATCA TTTTCTGTTA AATCTTTAGT ACTCGTAATG 1620 

10 

ACTTCGTCTT TTTTATTAAC AATTGCATAT CCACGCAACA TTGTATTAGT TGGACTTAAA 1660 

TTGTTTAAGT TTTCTACTTT ATTTTTCAAA TCATTTTTAT AACTTAATAT CTTAGAATTC 174 0 

AATAATTTAA CAAGTTGGTT TGTCAATTGA AGATTATnTT GTTGTTCTTG ATTAACACTA 1800 

15 

CTTAGTAATG CTTTTAAATn ATAACGTTGG TGCAACAGCA TTAAATCGAO GCCCOGGTGG 1860 

TCCAAAGTTG CCCGAATTnG TGGTTTCAGG CCC 1893 
20 (2) I KFORMAT I ON FOR SEQ ID NO: 156: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 156: 



35 



40 



45 



AAAATATATT 


CCTTCACTTA 


ATATTCAATT 


AGAGAAAAAC 


ATGGTGATTG 


TAATATGTTG 


60 


TGCAATATTT 


CTGGGTGTTT 


TAATACTTTT 


TTTATTTCTG 


AATCGTAAGC 


TAAGGTTGGA 


120 


AATTTATAAT 


AATAACTCTA 


GTAAAGGGAA 


AATAATTTTA 


TTTCCTTCAT 


TAAAAAACTT 


180 


TTGTTTCACA 


ATATTTTATT 


ATTTTTTATT 


TGGCGGTCTT 


TCAATAATGG CTCTAAGTAT 


240 


GTTATTAACT 


TTAAATCCTC 


AAAATATAAT 


AGGCTTTATT 


GGTTGGTTGG 


TAATGACTGC 


300 


AGGTTTCTTT 


CTGTTAAACA 


TGTCATCGAT 


TATTGACAAA 


AAAATTTATG 


TATTATCTAA 


360 


AACTAACACG 


GTGGAAAAAT 


GATGGTTTAG 


CTGGATTTAC 


TGCAGGTTCT 


ATTTCGGCAA 


420 


TACTTGTATA 


TTGGACCAAT 


CAAAAAAATG 


AATTTGGAAT 


AAAAGATAAA 


AACGATTGGA 


480 


TAGGACATAA 


ACTAGACGTT 


GGTATAGATG 


CTGTAGAAAA 


ATCTGCAGAA 


AAAACAGTAG 


540 


ATGGTGTTGA 


AAATGTCATG 


GTGAAGCTTC 


AAAAAGTATT 


TCTAATCATA 


TAAGCCCTAA 


600 


GAAATGGAGC 


TGGTAAATGT 


TGCTATGCGA 


ATCTAAAATC 


ATCAATAAAA 


ACCCAAAATA 


660 


TAGAATTATT 


AAATATAATG 


ATGAATACTT 


AATGGTCGAT 


ATAATAAGCA 


CTTGGATTAG 


720 


TTTATTTTTT 


CCTTTTATTA 


ATTGGTTCAT 


CCCaAAAGaA 


TACGTCAAAA 


TTAGTAGAGA 


780 
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(2) INFORMATION FOR SEQ ID NO: 157: 

<i) SEQUENCE CHARACTERISTICS: 
5 (A) LENGTH: 2343 base pairs 

<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 157: 

AGTAAGATAA TTTTCAATTA GAAAATATCT TACTGCTGTT CTCTATTTAT ACAATACTTC 60 

15 GTATTGAATG GcTTCGCTTT CCTAGGGTGC CGTCTCAGCC TTGGTCTTCG ACTGGCACTG 120 

CTCCCTCAGG AGTCTCGCCA TTAATACTAC GTATTAACAT GTAATTTTAC TTTGAAATAC 180 

TTTTAAAAAA TAAGACACTT TGCCCAACTT GCACATAAAT GTAAAATTCA ATAAAATGAA 240 

20 TTTTCTGTGT TGGGTCCCTT CTTATAATTT AATAAATACC ACTAAACTAA ATTAACGAGG 3 00 

TGCCTTATGT ATAAAAATTA TAACATGCCC CAACTACACT ACCAATAGAA ACTTCTGTTA 360 

GAATCCCTCA AAATGATATT TCACGATATG TTAATGAAAT TGTTOAAACr ATACCTGATA 420 

25 GCGAATTCGA TGAATTCAGA CATCATCGTG GCGCAACATC CTATCATCCA AAAATGATGT 4 80 

TAAAAATCAT CTTATATGCA TATACTCAAT CTGTTTAATT ATGTTCAAAG CATTAAGGTA 540 

ACAAGACAAT ATCTAAGATA TCAAAGATAG AAATTTTTTG ACGTTGTTGC TGATTGTAAA 600 

30 CATAACCATC AATTTCATAA TTAATAGCAT CAATACGATA AATGGTTAAG CGTACTGAAT 660 

CTACAAAGCC ATTATTATAA AATTTAACTT CTACAGGTTG GGCATATTGT AG CGCCTCGT 720 

GTAGCCGAAT GTTTAGCTCA GCCAATTGAT CATCTGATAA TACAGGACGT GTAATTTTGT 7 80 

35 

TTTGGTCGAT AATGTATTGT TGAATCGTTT CGAATTGTTC GGGTAATGTT GCAAAAGGAG 840 

CCGStTTAAT CATGCCTCTT CCCATAGGTA TATTGTTATC TAGTAATTCT CTTGGAACGT 900 

TACGATAATC AGTTTCTTCT TCATAACTTG TCATCCTTAA TTCACCCCAA TCTGATAATT 960 

40 

ACATTATACG AACATGTGTT CTATTTTGCA ACAAAAATTT TGTGGaAGCA TAAACGCGTT 1020 

AATAATTAAT GCTCGTGtAA GTAAAAAAGA GGGATTAATT AAAATCGAAT AATGaCATAT 1080 

45 CACaGCAAAT AGTTCTTTTA AAGTAGTTAA ATAGTTTTAG CTTTAAGGAA aTGATAAaTG 1140 

ATTGTwAATT CTAGCTAAAA TTTAATAAAA TGAAAATAAG ACTAACATGG AGGGGTAAAA 1200 

GTAATGACAA ATGGATATAT TGGTTCTTAC ACTAAAAAGA ATGGTAAAGG GATTTATCGT 1260 

SO TTTGAATTAA ACGAAAATCA GTCACGTATT GATTTATTAG AAACAGGATT TGAATTAGAA 1320 

GCGTCTACAT ATTTGGTGCG TAATAATGAA GTTTTATATG GAATCAACAA AGAAGGAGAA 1380 
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10 



15 



TGTTTGTCTT CAAAAGCTGG TACAGGTTGT TATGTATCGA TTTCAGAAGA TAAACGATAT 1500 

TTATTTGAAG COGTATATGG TGCTGGCATC ATACGTATGT ATGAATTAAA TACGCACACA 1560 

GGTGAAATTA TACGTCTAAT TCAAGAACTT GCACATGATT TTCCAACAGG TACACATGAA 1620 

AGACAAGATC ATCCACACGC ACATTATATT AATCAAACTC CAGATGOTAA GTACGTTGCA 1680 

GTAACAGATT TAGGTGCTGA TCGTATCGTT ACTTATAAAT TTGATGACAA CGGGTTTGAA 1740 

TTTTATAAAG AATCTTTATT TAAAGATAGT GATGGGACAA GACATATTGA ATTTCATGAT 1800 

AATGGAAAAT TTGCTTATGT CGTACACGAA TTATCAAATA CTGTGAGTGT TGCAGAATAT 1860 

AATGACGGTA AATTTGAAGA GCTCGAGCGT CATTTAACAA TTCCTGAAAA CTTTGATGGA 1920 

GATACTAAAC TTGcAGCAGT GCGTTTATCT CATGaTCAAC AATTCTTATA TGTATCTAAT 1980 

AGAGGGCATG ATAGCATTGC AATTTTTAAA GTTCTTGATA ATGGTCAACA CTTAGAACTA 2040 

20 GTAACAaTTA CTGAAaGTGG TGGTCAATTC CCAAGAGATT TTAATATTGC CTCATCAGAT 2100 

GACCyTTTAG TTTgTGCTCA kGaGCaAGGA GATTCAGTTG TAACTOTTTT CGAAAGAAAT 2160 

AAAGAAACAG GTAAAATTAC GCTATGTGAT AACACTCGTG TAGCATCTGA AGGTGTATGT 2220 

26 GTCATATTTT AATCTTTAAT TAATCATGAT AAAAAGAAAA CCATGTTTCC AAAAAATTTG 2280 

TGTATACCTT GAAATTTATT GnTTTCCAGn ACATCAATTA TGGGAAGGAT GGnTTATTTT 2340 

TGT 2343 
(2) INFORMATION FOR SEQ ID NO: 158: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 837 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 158: 

AAATTGCCAG TTGGTATCGC TTCTGGTGCA GTAGTCGAAG GTTTCTTCCA AGGTATCATT 60 

CCGATTGGCT ATATCGTTAT GATGGCAGTA TTGTTATACA AAATTACTGT TGAATCTGGA 120 

CAATTTTTAA CAATTCAAGA TAGTATTACA AATATTTCAC AAGACCAACG TATTCAAGTT 180 

TTACTTATTG GATTTGCATT CAACGCATTT TTAGAAGGTG CAGCAGGATT TGGTGTACCA 240 

ATTGCAATTT GTGCACTTTT ATTAACACAA TTAGGATTTA ATCCATTAAA AGCTGCGATG 300 

so TTATGTTTAG TCGCAAATGC AGCGTCTGGT GCTTTTGGTG CGATTGGTAT CCCTGTAGGT 360 

GTTGTAGAAA CGTTGAAATT ACCTGGAGAT GTTTCAGTAT TAGGTGTTTC TCAATCAGCA 420 
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GGTTTTAGAG 


GTGTTAAAGA 


AACATTACCA 


GCAATTTTAG 


TAGTTTCAAT 


CACTTATACA 


54 0 




CTTACTCAAG 


QATTATTAAC 


TGTATTCAGT 


GGACCTGAAT 


TAGCAGATAT 


TATTCCACCG 


600 


5 


TTATTAACAA 


TGTTAGCATT 


AGCAGTATTT 


TCTAAAAAAT 


TCCAACCAAA 


ACACATTTAT 


660 




CGTGTTAATA AAGATGAAGA AATTGAACCT 


GGAAAAGCAC 


ATTCTGCAAA AGCAGTATTA 


720 


10 


CATGCATGGA 


GCCCATTCAT 




GTCATTGTAA 






780 


TTTAAAAACT 


TATTCTTACC 




TTATCATCAT 


TAGTATTTAA 


ATTCAACTTA 


840 




CCTGGaACAA 


TCAGCGAAGT 


TACG CAT AAA 


CCATTAGTAT 


TGACTTTAAA 


TATTATTGGA 


900 


1S 


CAAACAGGTA 


CAGCTATTTT 


ATTAACTATT 


ATTATTACAA 


TTTTAATGTC 


TAAAAAGGTT 


960 


AACTTTAAAG ATGCAGGTAG 


ATTATTCGGC 


GTTACATTTA 


AAGAGTTGTG 


GTTACCAGTT 


1020 




CTTACAATTT 


GTTTCATCTT 


AGCAATTTCT 


AAAATCACAA 


CTTATGGTGG 


TTTAAGTGCA 


1080 


20 


GCAATGGGTC 


AAGGTATTGC 


TAAAGCAGGT 


AATGTCTTCC 


CAGTTCTATC 


ACCAATTTTA 


1140 




GGTTGGATAG 


GTGTGTTTAT 


GACAGGATCA 


GTTGTAAATA 


ACAACTCATT 


ATTTGCACCA 


1200 




ATTCAAGCTT 


CTGTTGCACA 


ACAAATTGGA 


ACAAGTGGTT 


CACTTCTTGT 


ATCTGCTAAT 


1260 


25 


ACAGTTGGTG 


GTGTAGCGGC 


AAAATTGATT 


TCACCACAAT 


CAATTGCAAT 


TGCAACTGCA 


1320 




GCAGTAAAAC 


AAGTTGGTAA 


GGAATCAGAA 


TTATTAAAAA 


TGACATTGAA 


ATACAGTGTA 


1380 




TGTTTACTAA 


TATTCATCTG 


TATTTGGACT 


TTCATCTTGT 


CATTATTATA 


AAAAAACGTA 


1440 


30 


TTTCAAAATA 


TAAATATACA 


GAAGGTGAGA 


TGTTTTCTAA 


CATCTCATCT 


TTTTTTTATG 


1500 




GATCATTAAT 


GAAAGAAGTT 


TGACATTATA 


ATAATGGTAG 


CGCTTTATGT 


TAAAATGAAT 


1560 




AGTGAGTAAT 


CAGCAATCAA 


ATTAAATTGG 


TTGATAGCTG 


TTAAGGTTTG 


TGGTTTTGTC 


1620 


35 


TTTGTG CTAT 


CG Cn CAT AAA 


uiAI A1AA1 1 


AAAGTAGTTT 


CGTTATTATA 


AAATA1 1AAT 


1680 




ATACATAGTA 


GATAGTAATA 


GAGCATCACC 


ATGGGAACCT 


ATTGAGACAC 


TTATTGATTT 


1740 


40 


AAAGTGGTAT 


TAATATGTCG 


TATTTCTCGA 


ACGTTCCATT 


ATTCATTTTA 


AAAAGGGGGA 


1800 


CTGTATTTGT 


TATGACAACA 


CAACATAGCA 


AAACAGATGT 


CATCTTAATT 


GGTGGCGGTA 


1860 




TTATGAGTGC 


aCATTAGGAA 


CATTACTTAA 


AGAATTATCA 


CCTGAGAAAA 


ATATTAAAGT 


1920 


45 


GTTTGAAAAA 


TTAGCACAAC 


CTGGCGAAGA 


GAGTTCAAAT 


GTATGGAATA 


ATGCCGGTAC 


1980 




AGGGCATTCA 


GCACTTTGCG 


AGTTGAACTA 


TACAAAAGAA 


GGTAAGGATG 


GCACAGTTGA 


2040 




TTGTAGTAAA 


GCAATTAAGA 


TAAATGAGCA 


GTACCAAATT 


TCAAAACAGT 


TTTGGGCATA 


2100 


60 


TTTAGTTAAA 


ACAGGACAAT 


TAGATAACCC 


AGATCGCTTT 


ATTCAAGCGG 


TGCCACACAT 


2160 




GAGTTTTGTC 


ATTGGCGAAG 


ATAATGTAGC 


TTTTATAAAA 


AGTCGTGTTG 


CAACGTTAAA 


2220 
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GGTACCGTTA ATGATTGAAG OTCOTAAOTC 


TGATGAACCA 


ATTGCTTTAA CTTATGATOA 


2340 




AACTGGTACa 


gATGTTAACT TTGGTGCGTT AACTGCAAAG TTATTTGATA ATTTAGAGCA 


2400 


5 


ACGTGGTGTG 


GGAATTCAAT 


ATAAGCAGAA 


TGTATTAGAC 


ATCAAGAAAC AGAAATCTGG 


2460 




GGTATGGCTA GTTAAAGTTA AAOATTTAGA AACTAATGAA ACGACAACAT ATGAATCTGA 


2520 


10 


TTTTGTATTT 


ATTGGTGCTG 


GCGGTGCGAG 


TTTACCATTA 


CTCCAAAAGA CTGGGATTAA 


2580 


ACAATCAAAA 


CATATTGGTG 


GTTTCCCGGT 


AAGTGGATTA 


TTCCTGCGCT GTACAAATCA 


2640 




AGAAGTGATT 


GATCGTCATC 


ATGCTAAAGT 


GTACGGAAAA 


GCAGCAGTGG GTGCGCCACC 


2700 


1S 


AATGTCAGTG 


CCGCACTTAG 


ATACACGTTT 


TOTAGACGGC 


AAGCGTTCAT TGTTATTTGG 


2760 




TCCATTTGCA GGTTTCTCAC 


CTAAATTTTT 


AAAAACAGGT 


TCACATATGG ATTTAATTAA 


2820 




ATCGGTTAAA 


CCAAATAATA 


TCGTGACGAT 


GTTATCTGCA 


GGTATCAAAG AAATGAGTCT 


2880 


20 


TACGAAGTAT 


TTAGTGTCAC 


AATTGATGTT 


ATCTAATGAT 


GAGCGTATGG ATGATTTAAG 


2940 




AGTCTTTTTC 


CCAAATGCTA 


AAAATGAAGA 


TTGGGAAGTG 


ATTACAGCAG GGCAACGTGT 


3000 




CCAAGTAATC AAGGATACTG AGGATTCTAA AGGTAACTTA CAATTTGGTA CTGAAGTTAT 




25 


TACGTCAGAT 


GATGGCACAT 


TAGCTGCATT 


ACTTGGTGCA 


TCACCTGGTG CGTCAACAGC 






TGTAGATATT 


ATGTTTGATG 


TTTTACAGAG 


ATGCTATCGT 


GATGAATTCA AAGGATGGGA 


lion 




ACCAAAGATT 


AAAGAAATGG 


TGCCGTCATT 


TGGTTATCGC 


tTAACAGATC ATGAGGATTT 


324 0 


30 


ATATCATAAA ATTAATGAAG 


AAGTAACTAA 


GTATTTACAA 


GTTAAATAAT AAACGAAACG 


3300 




GTAATGTCTT 


TTTTAATGTG 


ATAGACATTA 


CCGTTTTTTA 


GTGGTTAATA AAAATCATTT 


336 0 


35 


TAATTGTTTC 


AGTTGCTTGT 


TAATAGTGTC 


TACGTAGTTC 


TTGTTTTTAA AGAATTGAAT 


3420 


TATCCAAATT 


AATACATAAA 


CCACAATGAA 


GATAATTGTG 


AATATGATTA GATAATGCAC 


3480 




TGTTAGTGGA 


AACCAACCGG 


CAAGCATTGC 


TAAAGGCAAG 


AATCCGACAT ACGTTGTTAT 


3540 


40 


GAAATGCATT 


ATAGTTGCTT 


TAGTAATGCT 


CCAATCTGTG 


TATTTAAAGA TAAAATCTCC 


3600 


AAGGAAAAAG 


ACGACGCCTA 


TGAGTAACCA 


TAAAATGATA 


GAAATCAACA TTACGGTAGT 


3660 




TTCTGTGAAA 


TGCGTATAAT 


ACAATATGCC 


AATAGTTGAT 


TGTGGGTTCA GTGGATAATA 


3720 


45 


TTTGCCGTCT 


GCAAATAACA 


TACTAAAGAA CAGTGAAAGG GACAAACCAA TGATTAAGCT 


3780 




AATAAATAAT 


GAGTTTTTCA 


AATTTTTCAT 


ATTGATAAGC 


GCTCCTTTAT AGATTTTAAA 


3840 




TAACGTCTAG AAGAATAGGT GTAGTGTGCA TCTTTAAGAT ACATACGTAT AAGTCCATTT 


3900 


SO 


GGCTCTAATA 


ATAATTTTTC 


AATGTAATAC 


TTGTTGACGA 


TTTCTGATTT GGAAATGCGA 


3960 




ATGAAATGTT 


GTGGTAACTG 


TTTTTCTAGT 


TCATAAAGTC 


GTAATTTTAG TTTGAATTTT 


4020 
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ACATTAATGA TATGOATTTC TTTGTCTATG TATCCGACTA ATGTATGTGA TTTOTCTAAA 4140 

TCATTGACTG CATTAATAAT ACTTTGAACG TTATCATTCA TTTTAGGTGC ATGTATATCA 4200 

ATATAAGATT CCGTCTCATT TGCATTGATA AATAAATTGA GTTTCATCAT AGOTTAATGC 4260 

CTCCTTCAAA ATTATTAAAC CATAAATGAC CATCGATATA TTTAAATTTT GTTGAATGGT 4320 

AGAAATTAAA TGTTAAGTGG CTAGAAAGCG CTAATCAATA TAAAAGATAC CTCCTGAAAT 43 80 

AAAAACAGAA ATGTTTTTTC AGGAGGTAGA GATTAAAGTG AATTATTTGG CAGTGTAATA 444 0 

GTAAAGGTGG TTACATACTC GTTACTTTGT GTGAATTGGA TTGTACCATG ATGCAATTCA 4500 

ATGATGGATT TTGTAATTGC AAGACCTAAA CCATTGCTAT TATCATGTTT GCTCACTTTA 4560 

TAAAAACGTT CAAATAAACG TGCTTCAGCT TGTGGACTAA TTGGTGAACC ATCATTACTT 4620 

ATTGTGAAAA TGATATTGTT GTGACTATGT TGCAAAGCGA TGTCAATGGC ACCACCAACA 4680 

TCTGTATACT TAATAGCATT TATTAATAAA TTACTCAATG CTTGATGTAA CAAACGTTGA 4740 

TTTCCTAGGA AATTGATGAT TCTAGGTCAG CTAAnATGAT TAACGACTTT TCATCAGCAG 4800 

CAnATTGTTC ATGTCGAATG ATATCnTTAA TGAGCTG 4837 
(2) INFORMATION FOR SEQ ID NO: 159: 

<i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1600 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 159: 

35 

ACAATTATTG G ATT ATT AT C AAGCAACGTT AATGGATGAC TTCCACTTAC AACAGAAATG 6 0 

CCCATAGATT CTAAATCTtT TGCATGAGCA T CTTGTG AT A AGTCTTTTCC ATCATTGACA 12 0 

GTTACATTCG CACCTAATTT ACTTAATAAT TTAGCTGCTT CATAACCACT TTTTGCCAAA 180 

40 

CCGACAACTA ATACATTTTT ATTTTCTAAC CCTGTATAAT TAAGCATCTT AATGCACTCC 24 0 

AATCCATAAA CCGATTAAAC CTGAAATCAG ACCAACAGCC CAAAATACTG TAACTACTTT 300 

45 CCATTCGCTC CATCCTATCA ATTCAAAATG ATGATGAATC GGACTCATTT TAAATATACG 3 60 

CTTTCCAGTC AATTTAAAGC TAGCGACTTG TAACATAACA GATAATGTTT CAATTACGAA 420 

TACTAAACCT ATAAAAATTA ATGATAATTC CTGATTAAGC ATGATTGAAA TGGTAGCAAA 4 B0 

60 TATACCACCT AAAGCTAAGC TACCTGTATC TCCCATAAAC ACTTTAGCAG GGTTAATGTT 54 0 

ATATGGTAAA AATCCTAAAA GTGCAAACAA CATAATGATA CAGAAAATAC CAATTGCCGT 60 0 
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TGCTAATCCA TCTAAACCAT CTGTTAAATT TACTGCATTA GAAAAACCTA CTTGCCAAAA 720 

AACAATGAAA ATAACATATG CAAATGATAG TGGGATTGCT ACATTCGTAA ATGGAATATG 780 

TATGCTCGTA GAAAAATTCA CCAAATGAAA CACATTACTT AAAACAAAGA ATATAATCGC 84 0 

AATACCAATT TGCGCCAAAA ACTTCTGTTT ACTTGTTAAA CCTTGGTTAT TCTTTTTAAC 900 

AACAATAATA TAATCATCTA TAAAACCAAT TAACCCAAAA CCAATCGTCA CAAATAATAA 960 

CAGTATGATT GGATTAGCTT GATCTACAAA TATAATAGCC ACCAAAGACG TTATCACAAT 102 0 

ACTTAATAGA AATGTTAGTC CACCCATOGT TGGTGTACCA GTCTTCTTCA TATGGCTTTG 1080 

TGGACCTTCT TCTCGAATAC TTTGACCAAA TTTCATCCTT TTTAATGTAG GTATTAAAAC 114 0 

AGGTACCAAA ACAAATGTAA TCACTAGOGC TAATAACGCA TATACAAAAA TCATAACTAT 1200 

CTCCTCTTCT TAATCCAGAC TTTTTTAACC ACTAATATAT TATCAATTTT TCAATTAAAT 1260 

20 AAACAAAGTT GTAATCAAAA TTTATAATTT TTCTTTTTTA CGGCATAAGA GGCCAGTATA 1320 

AAAAGTTTGC CTATAACAAA CAAGTTAATC TGACCTCGTC TACCTTAAAA TTCTCTATCA 1380 

ACACTTATTT ATAAAGATTA AATGAAGATG TTGTTTTCTA TCACAGCATT ACTTTAGTAA 144 0 

25 AAACAAATAG TGACAATACA TCCTAATTTA ATGTAGCCAT TCTTGTTAGT CCGACTTATC 1500 

CTTGTCAGTT TTACTGTCAG ATTTCnTCTT ATCATCTGAA TTTGAATCAG AATTATT CGT 1560 

CGAATTGCTG TCTACATTCT CTGGATGGAA AATTCTACGT 1600 
(2) INFORMATION FOR SEQ ID NO: 160: 



30 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1186 base pairs 

(B) TYPE: nucleic acid 
3S (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



40 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 160: 

ATTGCCTTTG TTTTAATTTT AAATCAAAAT tnGCCTATGAA AGATTTAAAT CAATTAATTT 60 

CTATAATATT ATCATTTTTA AAGCATATCA TTGTTTAGTT TTTTTATAAT TGGATAAATA 120 

CTAATAGTTA CTTTATAAAA CATTACATAG AGAAAGGTTA AGGAGTGCAC ATGTCGAAAA 1B0 

AGGATCACTC TTCTTCAAAA TACCTTAATT CTGTTAAGGA AGCGCAAGAG GAGTCAAAAA 24 0 

AGAAAAATAA AAGTAATCCC AAAATTGATG TTGATCGTAC ATATATTGAA CCTCAACAAT 3 00 

TCCAATCTAA GAAACCTAAA AAAGATGATC AGGTTTTCTT CTTATCAAGA TTAAATAAAC 360 

CTGCAAAATA TAAGAAAGAC TCTAATTTCT TATCATATCT CATCTATCGC ATAGGAAAAG 420 
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TGTTGCTTTT CCTATTAACA TT ATT AC CAT TTTTCAATAT TAAGCAGAGT CAAATTACTA 540 

ATATGTTAAG CAATGCACCC GCTGAAACAT CTACTCTAAT TAAGAGTGTA ATTGGTGATA 600 

5 TAACTCAAAA CTCCAGTGGT GGCTTATTAT CTATCGGTTT GATTTTAGCA ATTTGGTCAG €€0 

CTTCAAATGG AATGACTGCA ATTATGAATT CTTTCAATGT TGCTTACGAT GTAGAAGATA 720 

GCCGTAATGG AATCGTATTA AAACTACTAA GTGTTGTCTT CACTGTAGTT ATGGGCGTTG 780 

10 

TGTTTGTAGT TGCTCTAGCA TTACCAACGC TTGGTTCTGT AATTAGTCAT TTCCTATTCG 840 

GTCCACTTGG aTTTGACGAA CAAGTGAAAT GGATTTTTAA CCTTATTAGA ATTGTGTTAC 900 

CAATCATTAT TATATTTATC ATATTTATCG TGTTATATTC GGTTGCACCT AACGTTAAAA 960 

75 

CGAAGCTTAA GTCAGTATTA CCAGGTGCAG TATTTACTTC AATTATTTGG TTAGCTGGTT 1020 

CATTTGGTTT TGGTTGGTAT ATTTCAAATT TTGGTAACTA TTCTAAAACA TATGOCAGTA 1080 

20 TCGCGGGTAT CATCATTTTG TTACTATGGT TATATATCAC AAGTTTTATT ATAATTGTCG 1140 

GnGCTGAAAT CAATGCAATC ATTCATCAGC GTAGTGTAAT TAAAGG 1186 
(2) INFORMATION FOR SEQ ID NO : 161: 

25 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7872 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 161: 



35 



40 



45 



TCTTGAGCCA 


TCTTTTGAGC 


TAACTGACTA 


GATTGATACC 


CAAAAATCAT 


AGTTACCAAC 


60 


ATAAACTTTA 


ATTTTACCGA 


AGTCTAAATC 


AGCGATATGA 


GTACATACAT 


TATTTAAGAA 


120 


ATGACGGTCA 


TG CG AT ACT A 


CGATAACAGT 


ATTATCAAAG 


TTAATTAAGA 


AATCTTCTAA 


1B0 


CCAACTGATT 


GCTGGAATAT 


CGAGACCGTT 


AGTAGGCTCA 


TCCAGTAATA 


GTACGTCTGG 


24 0 


TTCACCGAAT 


AAACTTTG CG 


CTAATAATAC 


TTTAATTTTT 


TGGTTGTTTT 


CTAATTCAGC 


300 


CATTTTTTTA 


TCGTGTAAAG 


TTGGATCGAT 


ACCTAAACCA 


GATAAAAGGT 


TAGCAGCATC 


•360 


AGCTTCAGCA 


TTCCAACCAT 


TCATTTCTGC 


AAATTCACCT 


TCAAGTTCAG 


CAGCACGGAT 


420 


ACCATCTTCA 


TCACTGAAAT 


CTGGCTTCAT 


ATAGATTTCA 


TCTTTTTCTT 


TCATAACCTC 


480 


ATAAAGACGT 


TCGTGACCTT 


TAATTACAAC 


ATCAAGCACG 


CGTTCATCTT 


CATAAGCATA 


540 


GTGGTCCTGT 


TTTAAAACAG 


CTAGACGTTC 


ATTTTTCCCT 


AATGAAACAT 


GTCCTGTTTG 


600 


AGAATCTAAT 


T CACCAG AT A 


ATATTTTTAA 


GAATGTTGAT 


TTACCTGCAC 


CATTCGCACC 


660 
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ATCTCCAAAA CGTAAACTCA CATCAGTTAC TTGTAACATG CATTTTCTCC TTTTTTTCAT 780 

TCGATATTCT AACGGAAGAA TTATATCATA TTATCGTCAC AGTTTCGACC TCATATAAGT 840 

TGTAATGATA GAATGACTCA CACATGTTAT AATAATAAAG AATACAAGAA TCGAAGGAGA 900 

ATAACATGGC ATTAGACAAA GATATAGTAG GTTCTATAGA ATTCCTTGAA GTAGTAGGGT 960 

TACAAGGTTC AACTTACCTT TTAAAAGGAC CAAACGGTGA AAACGTAAAG TTAAACCAAT 102 0 

CAGAAATGAA CGATGATGAT GAATTAGAAG TAGGTGAAGA ATATAGTTTC TTCATTTATC 1080 

CAAACCGTTC AGGTGAATTA TTTGCAACTC AAAATATGCC TGATATTACG AAAGATAAAT 114 0 

ATGACTTTGC TAAAGTACTT AAAACGGATC GCGATGGGGC ACGTATAGAT GTTGGATTAC 1200 

CCCGTGAAOT GTTAGTACCA TGGGAAGATT TACCAAAAGT GAAATCACTA TGGCCACAAC 1260 

CTGGTGATTA TTTGCTAGTT ACATTACGAA TTGACCGTGA GAATCATATG TATGGACGTT 1320 

2Q TAGCGAGTGA ATCTGTTGTA GAAAATATGT TTACACCTGT ACACGACGAT AATTTAAAAA 1380 

ACGAaGTCAT TGAAGCCAAA CCTTACCGOG TATTACGAAT TGGTAGCTTT TTATTAAGCG 144 0 

AATCAGGTTA CAAAATTTTC GTACATGAAT CAGAACGTAA AGCTGAACCA AGATTAGGTG 1500 

25 AATCTGTTCA AGTTAGAATT ATCGGGCATA ATGATAAAGG TGAGTTAAAT GGTTCATTTT 1560 

TACCACTTGC ACATGAACGT TTAGACGATG ACGGCCAAGT CATCTTTGAT TTACTAGTTG 1620 

AATATGATGG TGAATTACCA TTCTGGGACA AATCAAGCCC TGAAGCGATT AAAGAAGTAT 168 0 

30 TCAATATGAG TAAAGGTTCA TTCAAACGTG CAATCGGTCA CTTATATAAA CAGAAGATTA 174 0 

TTAATATAGA AACAGGTAAA ATCGCTTTAA CTAAAAAAGG TTGGAGTCGA ATGGACTCAA 1800 

AAGAATAATC ATTTTTACAC GTGTCGTAGG ATGCGTGTTT TTTTTATTCA ATATTAAATC 18 60 

GGACAGATGA AGTAGTTTTT TAAACATTCC TTTCAAAGTA AAAAATTAAA * TAATTCAAAC 1920 

GAATAGGCTG GGaCATTAAG TTCTTAGGCA ATGTAAAAAA GCTGATTTCT ATTAATTATT 198 0 

TGATGGAAAT CAGCTTTTTT GATATGTATT TTATAATGTA CAGCTCGTTG AGCTGCTATT 204 0 

TTCCTTATAT TAAGTGCCAT TAATACAAAA CCTAGCTCTC GTTTAACTTT ATTTATTCCT 2100 

CGAACTGACA TTCGAGTGAA aCCCAAAATA GCCTTCATAA ATCCAAAAAC AGGCTCTACA 2160 

TAAATTTTTC TATGACTATA GA TTTT TTTC GTTTCTGGTT CAGAAAGCTT TTGaTTAATT 2220 

TGGGCTTTAA TGTATTTCAA AGTAAAATTA CATGTTAATA CGTAGTATTA ATGGCGAGAC 2280 

TCCTGAGGGA GCAGTGCCAG TCGAAGACAG GGGCCCCAAC ACAGAAGcTG ACATATAGTC 234 0 

50 AGCTTACAAC AATGTGCCGG TTGGGGTGGC TGAGACGGCA CCCTAGGAAG GGACCCGTCA 24 00 

TCAAAAATTC TATTTATAGA ATTTTACAGT AATGTGACAG ACGGGCAAAG CGAAgCCATT 24 60 
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20 



25 



30 



35 



40 



45 



50 



CTTACTGCTG 


TTTTTTTAGG 


GATTTATGTC 


CCAGCCATTT 


TTGTATTCAT 


ATTTAAATTT 


2580 


CGATAATTTT 


TCAGGAAGCA 


TTTTAATTTT 


ACTAATGAAG 


CAATATTTTT 


TAGATTAACA 


2640 


AAAATTAATA TTTACATTTT 


CTTAACAATT 


TTTTATGTAA 


CATTTACAGT 


TTCTAAAAAT 


2700 


GAGGTTAATA ATTCAAGGTT AAGATAAAGA TGTAATCAAT ACAAATACTA TTTGTTGTTC 


2760 


ATACAGGGAG 


GATATTTCAA 


TGAAAAAATG 


GCAATTTGTT 


GGTACTACAG 


CTTTAGGTGC 


2820 


AACACTATTA 


TTAGGTGCTT 


GTGGTGGCGG 


TAATGGTGGC 


AGTGGTAATA 


GTGATTTAAA 


2880 


AGGGGAAGCT 


AAAGGTGATG 


GCTCATCAAC 


AGTAGCACCA ATTGTGGAGA AATTAAATGA 


2940 


AAAATGGGCT 


CAAGATCACT 


CGGATGCTAA 


AATCTCAGCA 


GGACAAGCTG 


GTACAGGTGC 


3000 


TGGTTTCCAA 


AAATTCATTG 


CAGGAGATAT 


CGACTTOGCT 


GATGCTTCTA 


GACCAATTAA 


3060 


AGATGAAGAG 


AAGCAAAAAT 


TACAAGATAA 


GAATATCAAA 


TACAAAGAAT 


TCAAAATTGC 


3120 


GCAAGATGGT 


GTAACGGTTG 


CTGTAAATAA AGAAAATGAT 


TTTGTAGATG 


AATTAGACAA 


3180 


ACAGCAATTA 


AAAGCAATTT 


ATTCTGGAAA AGCTAAAACA 


TGGAAAGATG 


TTAATAGTAA 


3240 


ATGGCCAGAT 


AAAAAAATAA 


ATGCTGTATC 


ACCAAACTCA 


AGTCATGGTA 


CTTATGACTT 


3300 


CTTTGAAAAT 


GAAGTAATGA 


ATAAAGAAGA 


TATTAAAGCA 


GAAAAAAATG 


CTGATACAAA 


3360 


TGCTATCGTT 


TCTTCTGTAA 


CGAAAAACAA 


AGAGGGAATC 


GGATACTTTG 


GATATAACTT 


3420 


CTACGTACAA 


AATAAAGATA 


AATTAAAAGA 


AGTTAAAATC 


AAAGATGAAA 


ATGGTAAAGC 


3480 


AACAGAGCCT 


ACGAAAAAAA 


CAATTcAAGA 


TAACTCTTAT 


GCATTAAGTA 


GACCATTATT 


3540 


CATTTATGTA 


AATGAAAAAG 


CATTGAAAGA 


TAATAAAGTA 


ATGTCAGAAT 


TTATCAAATT 


3600 


CGTCTTAGAA 


GATAAAGGTA 


AAG CAGCTGA 


AGAAGCTGGA 


TATGTAGCAG 


CACCAGAGAA 


3660 


AACATACAAA 


TCACAATTAG 


ATGATTTAAA 


AG CATTTATT 


GATAAAAATC 


AAAAATCAGA 


3720 


CGACAAGAAA 


TCTGATGATA 


AAAAGTCTGA 


AGACAAAAAA 


TAATAAGACG 


CAATTTCAAA 


3780 


TGTGTCTTGA 


AACATGATTT 


TGATGGTGAA 


TCATTATTTA 


GAGTACAAAG 


CTTGATTTAT 


3840 


CGAGACGCTG 


ATTTTGACAT 


TCAGTTAGTC 


TAcAAGCTTA 


TCAACTTAAA 


ATAGTGGTTC 


3900 


ATCATTATTT 


TACAAATCTA 


ATTATTTTGG 


GAGTAATAGA 


AAGAGGTTTG 


ATTATGACTT 


3960 


CATCTACTAA 


TGTTAAAGCT 


TTAATCGAAA AAAATAATAA 


TAAAAAAGGA 


AAGCATAATG 


4020 


ACAAAATTAT 


ACCAGTTATT 


TTAGCCGCAA 


TTTCAGCGAT 


TTCCATTTTA 


ACAACACTAG 


4080 


GTATATTAAT 


CACATTGCTT 


TTAGAAACCA 


TCACTTTTTT 


CACCAGAATT 


CCAATAACTG 


4140 


AATTTCTATT 


TTCTACTACT 


TGGAATCCTA 


CCGGTTCAGA 


C CCTAAGTTT 


GGTATCTGGG 


4200 


CATTGATAAT 


AGGGACTTTA 


AAAATCACAG 


TTATTGCGAC 


TATATTTGCA 


GTTCCAGTCG 


4260 
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AACCGATATT AGAAATTTTA OCAGGAATAC CAACAATTGT GTTTGGTTTC TTTGCATTAA 4380 

CCTTTGTTAC ACCAGTATTA AGATCTTTCA TACCAGGTCT TGGAGAGTTT AATGCTATAA 4440 

5 GTCCCGGCTT AGTTGTCGGT ATTATGATTG TCCCTCTCAT CACAAGTTTG AGTGAGGaTG 4500 

CAATGGCATC TGTACCAAAT AAAATTCGAG AAGGTGCCTA TGGACTTGGA GCAACTAAAT 4560 

TAGAAGTAGC AACTAAAGTC GTACTTCCCG CAGCAACATC AGGTATTGTA GCTTCAATCG 4620 

10 

TTCTCGCGAT TTCAAGAGCA ATTGGAGAAA CGATGATTGT ATCATTAGCG GCAGGTAGTT 4680 

CGCCAACAGC TTCATTAAGT TTAACAAGTT CGATTCAAAC AATGACTCGA TATATTGTTG 4740 

AGATAGCGAC AGGTGATGCA ACATTTGGAT CAAATATTTA TTACAGTATT TATGCTGTAG 4800 

15 

GGTTCACACT ATTTATCTTT ACCTTAATCA TGAATTTACT TTCTCAGTGG ATTTCTAAGC 4 860 

GTTTTAGGGA GGAGTATTAA TATGGAAACG ACAGATAATA ATAGACAATC ACTCGTCGAT 4920 

20 CAACAACTTG TCCAAAAACA TTTATCATCC AGAACGGTTA AAAATAAAGT GTTCAAACTC 4980 

ATATTTTTAG CATGTACATT ATTAGGACTT GTCGTACTTA TTGCGTTGTT AACTCAAACA 5040 

TTGATTAAAG GGGTAAGTCA TTTAAATTTA CAGTTTTTCA CTAATTTTTC TTCTTCAACA 5100 

25 CCATCTATGG CTGGCGTTAA AGGCGCGTTA ATCGGTTCAC TTTGGTTAAT GTTAAGTATC - 5160 

ATTCCATTAT CAATCATCCT AGGAATAGGT ACAGCTATAT ACTTAGAAGA ATATGCGAAA 5220 

AACAACAAAT TTACTCAGTT TGTTAAAATC AGTATTTC CA ATTTAGCTGG TGTACCATCA 5280 

30 GTTGTATTTG GGTTATTAGG TTATACTTTG TTCGTTGGTG GTGCAGGGAT TGAAGCCTTG 5340 

AAAATGGGTA ACAGTATATT GGCAGCAGCG CTAACAATGA CCTTACTGAT ATT AC CAATT 54 00 

ATTATTGTTT CAAGTCAGGA AG CAATT AG A GCTGTACCTA ACTCAGTACG CGAACTTcTT 54 60 

35 

ACGGCTTAGG TGCTAATAAA TGGCAAACGA TAAGACGTGT TGTCTTACCA GCAGCGTTAC 5520 

CTGGTATTTT AACTGGATTC ATTTTGTCTC TTTCAAGAGC ACTGGGAGAA ACAGCGCCAC 5580 

TTGTGCTAAT CGGTATACCG ACTATATTAT TGGCAACACC TAGAAGTATA TTGGATCAAT 5640 

40 

TTTCAGCATT ACCTATCCAA ATATTTACTT GGGCGAAAAT GCCTCAAGAA GAATTCCAGA 5700 

ATGTTGCATC GGCAGGCATT ATCGTTTTAC TAGTTATCTT AATCTTAATG AATGGCGTTG 5760 

45 CGATTATTTT ACGTAACAAA TTTAGTAAAA AATTCTAATT TAAACAATCA ATCTCATTTA 5820 

TCTATTAAAA AGGGAGTTTT AAATATGGCG CAAACACTTG CACAAACTAA ACAAATATCT 5880 

CAAAGTCATA CGTTTGATGT CTCACAAAGT CATCATAAAA CACCAGATGA TACAAACTCA 5940 

60 CATTCTGTTA TATATTCAAC ACAAAATTTA GACTTATGGT ATGGCGAAAA TCATGCATTA 6000 

CAAAATATTA ATTTAGATAT TTATGAAAAC CAAATTACTG CCATTATAGG TCCATCTGGT 6060 

55 
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AAAACAGCTG GTAAAATATT ATATCGAGAT CAAGACATTT TTGATCAAAA ATATTCTAAA 6180 

GAACAATTAC GTACAAATGT GGGCATGGTC TTTCAACAAC CTAATCCATT TCCAAAATCA 6240 

6 ATATACGATA ATATTACTTA CGGTCCAAAG ATTCACGGTA TTAAAAATAA AAAAGTTCTT 6300 

GATGAAATCG TTGAGAAATC ATTACGTGGC GCTGCAATTT GGGATGAATT AAAGGATAGG 6360 

TtGCACACAA ATGCATATAG TTTATCCGGT GGGCAACAAC AACGTGTTTG TATCGCGCGT 6420 

10 

TGTTTAGCAA TTGAACCTGA AGTCATTTTA ATGGATGAAC CGACATCAGC ATTAGATCCA 64 80 

ATCTCAACAT TAAGAGTAGA AGAGTTGGTT CAAGAACTAA AAGAAAAGTA TACAATTATT 6540 

ATGGTtACAC ATAATATGCA ACAAGCAGCT CGTGTATCAG ATAAAACTGC ATTTTTCTTA 6600 

1S 

AATGGTTATG TCAATGAATA TGATGATACT GATAAAATTT TCTCTAACCC ATCAAACAAG 6660 

AAAACAGAAG ATTATATTTC AGGAAGGTTT GGTTGATATA TAATGGCAAT AATTAGACAA 6720 

CGATATCAGG AGCAACTTGA TGATTTAATA AAAGAATTAC GTCGGTTAGG TGCaAATGTC 67 80 

20 

TATGTGAGTA TTGaAAATGG TATAAAAtCA TTAAGTATTG aCGATAGAGG CTTTGCACGA 6840 

CAAACAGTTA AAAACGATAA ACATATCAAT CAATTAAATT ATGATATTAA TGAGCGAGTT 6900 

25 ATCATGTTAA TTACAAAGCA ACAGCCCATT GCGAGTGATT TGCGTATGAT GATTTCTTCA 6960 

TTAAAAATCG CCTCCGATTT AGAAAGAATA GGAGATAATG CCTCGAGTAT TGCCAATATT 7020 

CGATTG CGTA CAAAGATTAC AGATGATTAT GTGTTAACCC GTTTAAAGAC AATGGGTAAA 7080 

50 TTAGCTATGT TAATGTTAAA GGACTTAGAT CAAGCATTTA AAAAGAAAGA TACCGTATTA 7140 

ATAAGAGAAA TAATTGAGCG TGATGAAGAT ATCGATGACT TATATAGTCA TATTATTAAC 7200 

GCAACGTATC TTATTGATAA CGtCCATTTG TCGCTGCACA AGCTCATTTA GCAGCAAGAC 7260 

35 ATTTAGAACG TATTGGTGAT CATATTATTA ACATCGCTGA AAGTGTTTAT TTTTATTTAA 7320 

CAGOTACACA TTACGAACAA TAACTTAAAG TTATTACTAT AAAATCCCTT ACGATAAATA 73 80 

TATATTTCTA TTATTCATAA ACCCTCAAAA AAACCAAGAT TCTCACAATT AGTAATGTGA 744 0 

40 

AAATCTTGGT TTATATTGTT CTACTATAAA TTGTCTCGCA TCTTAGTTAT TTGCTTGCTC 7500 

AATTTCATCT GTTAATTTTT CAACTTCATC GACTAAATCA GAAATATATT GAATTGTAGA 7560 

TTTAAGTGGC TGTTCTGTAG TAATGTCTAC ACCTG CAATG TTTGCAAGTT CGACAGGTGA 7620 

45 

TACACTACCA CCTTTTTTCA ATGTTTCTAA CCAAGCATCA ACAGCTGGTT GGCCTTCATT 7680 

TTTAATCTTT TGAGAAACGA CAGTTCCGAT TGTTAAGCCA GCAGAATACG TATACGAATA 7740 

SO TAATCCCATA TAGTAATGAG GTTGACGCAT CCATGTTAAT TCAGCACCCT CAGTCATGTC 7800 

TACTG CATCT CCAAAAAATT GTTTATAAAC ATTTAGCATT ATTTCATTTA ATGTnCGGCG 7860 

55 
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(2) INFORMATION FOR SEQ ID NO: 162: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 798 base pairs 

(B) TYPE: nucleic acid 
<C> STRANDEDNESS : double 
(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 162: 





TTTTTTCTTT 


TCTTCATTTG 


AAAATTGATC 


ATTCAGCAAT ATAAGCGTAT 


TTGTTAATGA 


60 


15 


TTTAGGTGTT 


CCAATTTCAT 


AATCCCACCA 


ATTTAAGTTG 


GTATTCTTGC 


CAGTTGTTTT 


120 




AGTAAAATTC 


TCACTTAATT 


CTTTTACTTT 


TTTATCTGGT 


TCTTTTCCAT 


ATGCATTTTT 


180 




ATOCAGCCAC 


TCAAGGGCAT 


CTTTCACTTT 


CTTCTTATTT 


TCGTCAGTAT 


TTAAAGTGGT 


240 


20 


TTTAGGATTC 


CTCATCGCTT 


CTGCGATTTT 


CTCAATATTA 


CGATAGGTAC 


GAGTCATATG 


300 




AGAAGAATTA 


GTTTCAAGGG 


TTTCCGCTCC 


TGACCACAAG 


T ATTTC CT AC 


CACTTTCAGT 


360 




TTTCATTTCC 


TTGAGTAAAT 


TCGTCGCCTC 


TTTCTCTGTA 


GCATCAAACT 


TCTTCTTCAT 


420 


25 


ATCTGGATTA 


TTCTCATCAT 


ACTTATCATA 


ACCATAGTTA 


ACGTCCAGCC 


ATGTOTTCCT 


480 




CAATTTTTCA 


TAATCTGGCG 


TTTGAACATT 


CGTATCAGCC 


ACAGCGATTT 


GATGTTTATC 


540 




AACACTTCTG 


AATTCACCAC 


CATTCAAAGT 


AATCACACCA 


GCCATTAATA 


ACGTAATGGT 


600 


30 


GGATAATTTT 


TGCCATTTCT 


TTATTCTATA 


TGTCATTGaC 


ATGTCTCCTT 


TTTGTGTTGC 


660 




GCGTGCGCAA 


TGAATATTAT 


GATTAAATAA 


TGATTCAATT 


TTTCAAAATT 


CGTTAACGTA 


720 


35 


TACAAATGAC 


TGTCTACTGT 


CAAACAATCC 


ACAAAGAATG 


TTGATGt CAT 


ATaAACAATC 


780 


GATCACCCAA 


ATTTTCCG 










798 



(2) .INFORMATION FOR SEQ ID NO: 163: 

<i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 5132 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 163: 
TACAGGTTTT ACTATAATGG ATGGTATTTT GGCTAAACGA CATTGGTTTA GTCTTCTTTT 60 
60 TTTnACTTCC TAnATTTACA ATGGTATAAA TAATAATGCT ATATTTAGAA TGATGAGTAT 120 
ACTTACTGAA ACTAAATTAA AAGTGTCTGG TTCTTTACTA AAGATAGCTG CTATCCTTGC 180 
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AATACAAGTT CCAATGAGCG CAATTAAAAG TACTAACCCA ACGATGAAAC TCTOTTTGTC 300 

ACTTAACTCA AAGAAACTAT AGATAGGATA TTTTTTAATA ATCAAGCCAC CTAAAATCAT 360 

CCATAAAAAT ACGATAATTC CATAAGTCAC ATTTATAACA TACGTTATTT TTTGGTCACC 420 

AAATCGGACT AATGTATTTC GTAGAATCAG CATACCAATG ACAACACCTA AAATAACGAT 4 80 

ACTAGCTATA TAAAGTAAAA ATGCAATTGT CACATCAAAT GTACCCAAAT CTAAAAACCT 540 

AGGAATTAyA AyGACTGCTA AAATAAAAGC OAAGyACAAA GTAATATAkT TATACAAACC 600 

GGTAGTAAGA CTTATCTCAG GTGATAATTG ATCAGCCATT GACTTAATCG GTGTATTAAT 660 

AATTGAACTT GTATCTTCGT TATTTTTTTC AGCCATAGTT AAATGATCTT CGAGCTCTTC 720 

CAATAACTCT TCTACTTCTG CTTCAGTCTT ACCTCTAAAT AACAATTCAA CAOGTAATTT 780 

TTCTAAAAAA TCTTGAGATT GTTTACTTAA CATCGTTTTC CCCTCCAAAC AAGTTAATCA 840 

TCCCTTTATT CAAAACTTGC CATTTCGATT TAAATACTTT TAGTTCCTTT AAACCTGAAT 900 

CGGTAATCGT ATAGTATTTC CGCCTCGGGC CGCCATTACT AGATTTTTTT ATTGTCGTAT 960 

CAACGTATCC TlTrTTGTT T AAACGCATTA AAACTGGATA AATACTACCC TCACTTATCT 1020 

25 CTGGAAACTC TTGATTCTTA AGTTTCGTCA TAATTTCATA TCCATACGTT TCGCCTTGGG 10 8 0 

CAATGAGACC TAATATCGCC CCATCTAAGA GACCTTTCAT AATCTGATCT GACACTGACA 1140 

TTTTAATCAC CTACTATCTT ACATAATAAG ATAGTACATT GAGAACTTTT CGTCAACTAT 1200 

30 CTTTTATTGT AAGGTAGTTG TTGTACACAT TCCTTAAATG ACTAACAACT TTGTTAATAG 1260 

GGTAATACTT ACGGAAGTAT ATTTTATTTA TGGGGGAGGA ATTAATAATG ACTACAAAAA 1320 

CAGTATTTGA TGTCATTGAT ATGGGGTTAG GATATTTAGT AAATGTGTAT GATGCTTGGA 13 80 

AAGTTGAAAA GGTACTTGAT GATTATCATA AGCCTTTTTC TAATACCATT CATTGGCAAT 1440 

TTGGtCATGT ATTAACAATT TTTGAATCGG CCTTAGCTGT TGCTGGTAAA GAGAATATTG 15 00 

ATTTAAATAT CTATAGACCT TTATTCGGAA ATGGTTCGTC TCCAGATGAA TGGAAGGATG 1560 

AAGTACCGAG TATTGAAAGG ATTTTAGAAG GTCTCCAAAC TTTACCTGAA CGTGCACGAA 1620 

ATCTAACTGA AGATGATTTA GCAATTGAAT TGAAACAGCC AATTGTCGGT TGTAATAACT 16 BO 

TAGAAGAGTT ATTAGTATTA AATGCCATTC ACATCCCACT TCATGCTGGT AAAATTGAAG 1740 

AGATGTCTCG TATATTAAAA AATTTAAAAT AAATATGTGC TTATTAACCG TTAACAACAC 1800 

GTTAACGGgT TTTTTATTTG TTTAAAAGGT CACTTTTTTG AATTTAATAA ACACCATCTA 1860 

SO TAC CAGTTCT TCACCGATTC TCGAAAAATA ATTATATTAA TGATTTCGTT AATTTAATTT 1920 
TATATTTAAT TATTACTGTA CATCTTTTGT AGTTAGCTTT ATTCTTAAAT TGAAATATGT . 1980 



35 



45 



SS 



798 



10 



1S 



EP0 786 519 A2 

TACTCCCTAT CGTTGTAGGT CTCCTTATTT GGGCACTTAC ACCTTTTAAA CCGGATGCTG 2100 

TGGATCCAAC AGCATGGTAT ATGTTCGCAA TATTCGTCGC GACAATCATT GCTTGTATTA 2160 

CACAACCGAT GCCAATTGGG GCCGTCTCTA TAATTGGATT TACAATCATG . GTACTCGTTG 2220 

GCATTGTTGA CATGAAAACG GCTGTCGCTG GTTTTGGTAA TAATAGCATT TGGTTAATTG 2280 

CTATGGCATT TTTCATTTCG AOAGGATTTG TGAAAACAGG TCTTGGTAGA CGTATCGCAC 2340 

TTCATTTCGT CAAATTATTT GGTAAAAAAA CATTAGGATT AGCATATTCT ATCX5TCGGTG 2400 

TAGATTTAAT TCTAGCGCCT GCTACACCAA GTAATACCGC GCGTGCTGGT GGAATCATGT 2460 

TCCCAATTAT CAAATCACTT TCTGAATCAT TTGGTTCGAA ACCGAAAGAC GGATCAGCAC 2520 

GCAAAATGGG TGCATTTCTT GTTTTCACAG AATTCCAAGG TAATTTAATT ACTGCGGCTA 2580 

TGTTTTTAAC TGCAATGGCC GGTAACCCCC TTGCACAAAA TTTAGCATCT AGCACATCTA 2640 

20 ATGTTCACAT TACATGGAXG AATTGGTTTC TAGCTGCTTT AGTTCCTGGA CTTGTTTCCT 2700 

TAATTGTTGT ACCTTTTATT ATTTATAAAA TTTATCCACC AACTGTTAAA GAAACACCAA 2760 

ATGCTAAGAG TTGGOCTGAA AATGAATTAG CGACTATGGG TAAAATCGCT TTAGCTGAAA 2820 

2S AATTTATGAT TGGTATTTTT GTCGTTGCGT TAACACTATG GATTGTCGGA AGTTTCATTC 28B0 

ATATTGATGC AACTTTAACG GCCTTTATTG CGCTAgcATT gTTATTATTG ACAGGCGTCT 2940 

TAACATGGCA AGACATTTTA AACGAAACAG GTGCTTGGAA CACATTAGTA TGGTTCTCAG 3000 

TATTAGTGTT AATGGCCGAC CAATTAAACA AGCTTGGATT TATTCCTTGG TTAAGTAAAT 3060 

CCATTGCTAC AAGTCTTGGT GGCTTAAGCT GGCCTATAGT CCTGGTCATT TTAATATTGT 3120 

TCTACTTCTA TTCACATTAC TTATTTGCAA GTTCTACAGC ACATATCAGT GCGATGTATG 3180 

CAGCATTACT AGgCGTTGCC ATCGCAGCCG GTGCACCACC ATT ATT CAGT GCATTAATGT 3240 

TAGGTTTCTT CGGTAACCTA TTAGCTTCAA CAACACACTA TAGTAGTGGT CCAGCGCCGA 3300 

TTCTATTCTC TTCAGGTTAC GTGACTCAAA AACGTTGGTG GACAATGAAC TTAATATTAG 3360 

GTTTCGTCTA CTTTATTATC TGGATTGGTT TAGGATCACT TTGGATGAAA GTAATTGGTA 3420 

TATTTTAAAA TATTTAAATT AGCGCTCGAA TCTCATTGAT TTGGGCGCTT TTTAATTTGT 3480 

4S ATTTAAAATC AACCTTTGCT AAATCAAGAC TCCCTTTTTA AAATACGTTT ATCCTTTAAA 3540 

TCATTGCGTG CTTCACTGAA AATTTGTATA AAGATTTAAG TCATTACGTA ACATCACATA 3600 

AAATACATTT CTATACTATT CCGCTTCATT GATTAACATT ACGTATGCCC TCATAAATCA 3660 

SO TCATACAAAA AACACCTTCG TTTAAATTCA TTTTAATTGC GAATTCAACG AAAGTGCCTT 3720 

ATTTCATATT TAATGTTTCA AATTTATACG TCTGTCACTG TTACTGCACA CATACCTCAG 3780 
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TTATAGGGTT TTTGCOACCG GATGTTTCTT CAATTTAATO TATTGAOAAA GACTATATAA 3900 

CACAATACCT GTCCAAATAA ATATAAACGT AATTAATTGA TCTATACTAA AAGGCTCTTT 3960 

5 GAAAACAAAT ATGCCGAGTA CAAACATTAT TGTTGGTCCA ACGTATTGAA TAAATCCTAT 4020 

TAGCGAAAGT GGAATACGTT TTGCCCCGGC TGAGAATAGG ATTAGTGGTA TTGCCGTAAT 4080 

AGCACCAGAA AATAACAACC AAAATGATGA CATGTTCAAT CCAAATGACA TCTGATGTTG 4140 

10 

CTGCCATAAA TAAATAACGT ' ATATTAGTCC AGCAGGTGCG GTAACAATAC ATTCAATCGT 4200 

AATACTGCTG ATGGCATCAA TATGTACTAC TTTTTTCAAT AATCCGTATG TACCAAAGGA 4260 

TAACGCTAAT ATAATAGAGA CGATTGGGAA TTCTCCAATC TTGAGCGTCA TATATAATAC 4320 

15 

ACCGATGAAT GCGAATAAAA TGGCTAGCCA TTCAAATTTA TTGAATCTTT CTTTTAAAAA 4380 

GATAAGTGCG AGCAAAATGC TAACAAGTGG ATTTATATAA TAACCTAAAC TTGTTTGTAG 4440 

2Q GACOTGACCG TTCGTTACAG CCCAAATAAA TGTACCCCAA TTTAATGTAA TGACATAGCC 4500 

TGCTACGACA ATCGCTAATA GCTGAATGGG CTTGCCTAAC AATTGATTCA TATCTCGTTG 4560 

AAATGCATTG CGTTGTTTTT GTCCAACCGC GAGTATGAAA ATCATGAATA TTGCTGAAAA 4 620 

25 TATAATACGA AAGGCTAAAA TTTCAAATGC GCCTATTGCA TCAACGAACT GCCAATATAT 4680 

AGGTAGTATT CCCCACAGAA TGTATGCACT G AGTG CT AAA AATATG CCTT TTTTATACTC 474 0 

TGAATTCACC TTCAAACCTC CTTACTTTCC TAATTTTTAA TTTACTGCAT ACGCTCACTT 4 8 00 

30 GGTTATGCTA ATATAACGAT TTTACTAATA ATATTTCGAT AAAGATATCA TTTTGTTTAT 4 860 

ATTT CCCACA TTTATTCACC AACCACTAAA CAATATTAAT TTTATAAATA ATTCTGTACA 4 920 

AATCAGGGTA TATTGCCAGA AAGACTACCA TACAACATAA AGGATGGATA CAAATGACTT 4980 

35 

TACGTAAAAT TGGAAAG CCT GCAACACGCG CGCTAAATTC ACAAGGTATA TACACATTAG 5040 

AAGCAGTATC ACAATATACG AAGTCATCTC TAATGGAGAT GCATGGCGTT GGTCCTAAAG 5100 

CTATATCAAT ATTGGAACAA GCTTTATTTC AG 5132 

40 

(2) INFORMATION FOR SEQ ID NO: 164: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 22243 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

60 Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 164: 

AAGTAAATTA TATTATGAAT TTGCCTGTCA ATTT CTT AAA GACATTCTTA CCGGAACTAA 60 
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TAGAAGCAAT TAATAATGCy mAAGAAAAGA CAGCTAATAA TACCGGCTTA AAATTAATAT 180 

TTGCAATTAA TTATGGTGGC AGAGCAGAAC TTGTTCATAG TATTAAAAAT ATGTTTGACG 240 

AGCTTCATCA ACAAGGTTTA AATAGTGATA TCATAGATGA AACATATATA AACAATCATT 300 

TAATGACAAA AGACTATCCT GATCCAGAGT TGTTAATTCG TACTTCAGGA GAACAAAGAA 360 

TAAGTAATTT CTTGATTTGG CAAGTTTCGT ATAGTGAATT TATCTTTAAT CAAAAATTAT 420 

GGCCTGACTT TGACGAAGAT GAATTAATTA AATGTATAAA AATTTATCAG TCACGTCAAA 480 

GACGCTTTGG CGGATTGAGT GAGGAGTAGT ATAGTATGAA AGTTAGAACG CTGACAGCTA 540 

TTATTGCCTT AATCGTATTC TTGCCTATCT TGTTAAAAGG CGGCCTTGTG TTAATGATAT 600 

TTGCTAATAT ATTAGCATTG ATTGCATTAA AAGAATTGTT GAATATGAAT ATGATTAAAT 660 

TTGTTTCAGT TCCTGGTTTA ATTAGTGCAG TTGGTCTTAT CATCATTATG TTGCCACAAC 720 

20 ATGCAGGGCC ATGGGTACAA GTAATTCAAT TAAAAAGTTT AATTGCAATG AGCTTTATTG 780 

TATTAAGTTA TACTGTCTTA TCTAAAAACA GATTTAGTTT TATGGATGCT GCATTTTGCT 840 

TAATGTCTGT GGCTTATGTA GGCATTGGTT TTATGTTCTT TTATGAAACG AGATCAGAAG 900 

25 GATTACATTA CATATTATAT GCCTTTTTAA TTGTTTGGCT TACAGATACA GGGGCTTACT 960 

TGTTTGGTAA AATGATGGGT AAACATAAGC TTTGGCCAGT AATAAGTCCG AATAAAACAA 1020 

TCGAAGGATT CATAGGTGGC TTGTTCTGTA GTTTGATAGT ACCACTTGCA ATGTTATATT 1080 

TTGTAGATTT CAATATGAAT GTATGGATAT TACTTGGAGT GACATTGATT TTAAGTTTAT 1140 

TTGGTCAATT AGGTGATTTA GTGGAATCAG GATTTAAGCG TCATTTCGGC GTTAAAGACT 1200 

CAGGTCGAAT ACTACCTGGA CACGGTGGTA TTTTAGACCG ATTTGACAGC TTTATGTTTG 1260 

TGTTACCATT ATTAAATATT TTATTAATAC AATCTTAATG CTGAGAACAA ATCAATAAAC 1320 

GTAAAGAGGA GTTGCTGAGA TAATTTAATG AATCTCAGAA CTCCTTTTGA AAATTATACG 1380 

CAATATTAAC TTTGAAAATT ATACGCAATA TTAACTTTGA AAATTAGACG TTATATTTTG 1440 

TGATTTGTCA GTAT CAT ATT ATAATGACTT ATGTTACGTA TACAGCAATC ATTTTTAAAA 1500 

TAAAAGAAAT TTATAAACAA TCGAGGTGTA GCGAGTGAGC TATTTAGTTA CAATAATTGC 1560 

45 ATTTATTATT GTTTTTGGTG TACTAGTAAC TGTTCATGAA TATGGCCATA TGTTTTTTGC 1620 

GAAAAGAGCA GGCATTATGT GTCCAGAATT TGCGATCGGT ATGGGGCCAA AAATTTTTAG 1680 

TTTTAGAAAA AATGAAACAC TTTACACTAT TAGGTTATTG CCTGTTGGTG GATATGTTCG 1740 

50 TATGGCAGGA GATGGCTTAG AAGAGCCACC AGTCGAGCCC GGTATGAACG TTAAAATTAA 1800 

ACTTAATGAA GAAAATGAAA TAACACATAT CATATTAGAT GATCATCATA AGTTTCAACA 1860 
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CACTGCTTAT GATAATGAAA GACATCATTT 
AAATGGTAGC TTAGTTCAAA TTGCTCCGAG 
5 GCCGAAATTT TTAACATTAT TTGCGGGACC 

ATTTATTGGT CTTGCATATT ATCaAGGcAC 
TAAGTATCCA GCTCAACAAG CAGGATTACA 

10 

ATATAAAATA TCTGAATTTG ATGATGTTGA 
GACGACTGTT AAATTTGAAC GTGATGGTAA 
GACTGAAAAA AAACTGACTA AAGTAAGTTC 

IS 

AGCOAGTGAA CATACACTTT TTAAACCAAT 
TAGTACTTAT ATTTTTACAG CTGTAGTAGG 

20 CTCATTTGAT ATGTTAAATG GTCCGGTTGG 

AGCGGGTATC ATTAGCTTAA TTGGTt nCAC 
GAATTTAATT CCTATTCCTG CACTAGACGG 

2S G A TTTTCAGA AAACCAGTTA ATAAAAAAGC 

TTTCATGGT C GTTATAATGA TATTAGTAAC 
ATTTAGGAGG ATAAATAATT ATGAAGCAAT 

30 TGCCATCAGA AGCAGAAGCA CAAAGTCATC 

AAAGTACAAG TGGGATTTAT AGTTATTTAC 
CTGCAATTGT GCGACAAGAA ATGGAACGTA 

35 

TACAACAAGC TGAATTATGG GAAGAATCAG 
TGCGTTTACA AGATAGaCAT GGAAgACAAT 
TTACATCAAT AGTAAGAAAT GAATTGAAAT 

40 

aAATTCAATC TAAATTCCGT GATGAAAAGA 
ATTTATTATG AAAGATGCAT ATTCATTCCA 

4S TCAAGATATG TATCAAGCGT ATAGCCGTAT 

AGTAGTTGCA GATTCAGGTG CTATAGGCGG 
TGCTATCGGT GAGGATACAA TCGTTTACAG 

50 AAAAGCAGAA GTCGTTTACG ArcCAaATcA 

AATTGAAACA CCAAATGTTA AGACTGCGCA 

55 



TAAAATTGCT AGAAAGTCTT TCTTTGTTGA 1980 

AGACAGACAA TTTGCACATA AAAAGCCATG 204 0 

GTTATTTAAC TTTATATTAG CTTTAGTCCT 2100 

GCcTACGTCT ACTGTAGAAC AAGTCGCAGA 2160 

AAAAGGTGAT AAGATCGTCC AAATTGGCAA 2220 

TAAGGCGTTA GATAAAGTTA AAGATAATAA 2280 

AACAAAGTCA GTTGAATTAA CACCTAAAAA 2340 

AGAGACGAAG TATGTTCTCG GATTCCAACC 2400 

TGTATTCGGA TTTAAAAGCT TTTTAATCGG 2460 

TATGTTGGCT AGTATATTTA CGGGCGGATT 2520 

TATTTATCAT AACGTCGACT CAGTTGTTAA 2580 

TGCGTTATTA AGTGTAAACT TAGGTATTAT 2640 

TGGTCGTATT TTATTTGTTA TATATGAAGC 2700 

GGAAACAACG ATTATTGCTA TTGGTGCCAT 2760 

GTGGAATGAT ATTCGACGAT ATTTCTTATA 282 0 

CCAAAGTTTT TATACCAACG ATGCGTGACG 288 0 

GTTTATTATT GAAATCGGGT TTGATAAAAC 2940 

CGCTAGCAAC ACGTGTGTTA AATAATATTA 3000 

TCGATTCTGT TGAAATTTTA ATGCCAGCGT 3060 

GACGTTGGGG TGCATATGGC CCAGAATTAA 3120 

TTgCATTAGG TCCaACACAT GAAGAATTAG 3160 

CATACAAACA ATTACCGATG ACATT ATTC C 324 0 

GACCACGTTT TGGTTTAyTC GTGGGCGTGA 3300 

TGCTGACGAG GCATCATTAG ATCAAACGTA 3360 

TTTTGAGAGA GTTGGCATTA ACGCAAGACC 3420 

TAG CCATa CA CATGAATTTA TGGCATTAAG 3480 

TAAAGAAAGT GATTATGCTG CTAACATCGA 3540 

TaAGCATACT ACTGTGCAAC CTTTAGAAAA 3600 

AGAATTGGCA GACTTCTTAG GTAGACCAGT 3660 
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ATGACATTAA ATTAAAATCT 


XAX 1 


WAuAlAAiA X 


3780 








AAATTGTTAA 


TTTAGTTGGT 


(jCAAAlwtlAj 


vj X Xa^AC X AUU 


3840 


5 




vnlAAn(jAnn 


TCAAAATTTA 


TGCAGATAAT 


X X lu iuU\Au 


AXXTAAAXAA 


3900 








AAGATGGTTA 


TCACTTAATT 


AATGTAAA TO 


TAGG XAGAGA 


3960 




V* X X WAAwVa X X 


VjATvjAAXAIAj 


GCGATTTCCG 


TTTTATTTTA 


GAAGGCGAAA 


AGTTAAC5TGA 


4020 


10 


IwilCAQGC 


GTTGCACATT 


TTGCTGAAGG 


TATTGAAGTT 


GGTCAAGTAT 


TCAAATTGGG 


4080 




TACTAAGTAT 


TCAGAATCAA 


TGAATGCTAC ATTCTTAGAT 


AACCAAGGAA 


AAGCTCAATC 


4140 


15 


TTTAATTATG 


GGTTGTTACG 


GAATTGGAAT 


TTCTAGAACG 


CTAAGTGCGA 


TTGTTGAACA 


4200 


AAATCACGAT 


GATAATGGAA 


TTGTTTGGCC 


TAAATCAGTT 


ACTCOGTTTG 


ATTTACATTT 


4260 




AATTTCTATT 


AATCCTAAGA 


AAGATGATCA 


ACGAGAACTA 


GCAGATGCAC 


TATATGCTGA 


4320 


20 


ATTTAATACT 


AAATTTGATG 


TGTTGTACGA 


TGATCGTCAG 


GAACGTGCAG 


GTGTTAAATT 


4380 




TAATGATG CC 


GATTTAATTG 


GTTTACCACT 


GCGAATTGTT 


GTTGGTAAAC 


GTGCATCGGA 


4440 




AGGTATTGTA 


GAAGTTAAAG 


AACGTTTAAC 


AGGTGATAGC 


GAAGAAGTTC 


ACATTGATGA 


4500 


25 


CTTAATGACT 


GTCATTACAA 


ATAAATATGA 


TAACTTAAAA 


TAATTAAGAT 


CGAATGAATT 


4560 




ATAAGAGTAG 


GAAAAAGCTG 


AAAGAAATCT 


GATGCTTATG 


TCCTGCTCTT 


ATTAITTTTTG 


4620 




ATATAATGAT 


TATTCGATGA 




AAUAUATAo 1 


ATAATTAAAG 


ATAAATTTGT 


4680 


30 


TTTAACAATA 


TAATGATTAG 


LLAAA1A1AA 


f\.\y\-J\l. X lAAi 


TTTCTATCAT - 


TACTATGCTC 


4740 




ACATAATCTA 


AATATTGTTC 


GAACACGTAA 


AAGTAATTTC 


TATTTAAGGT 


GGTAATTGTC 


4800 




TTGGCAATGA 


CAGAGCAACA 


AAAATTTAAA 


GTGCTTGCTG 


ATCAAATTAA 


AATTTCAAAT 


4860 


35 


CAATTAGATG 


CTGAAATTTT 


AAATTCAGGT 


GAACTGACAC 


GTATAGATGT 


TTCTAACAAA 


4920 




AACAGAACAT 


GGGAATTTCA 


TATTACATTA 


CCAGAATTCT 


TAGCTCATGA 


AGATTATTTA 


4980 


40 


TTATTTATAA 


ATGCAATAGA 


GCAAGAGTTT 


AAAGATATCG 


CCAACGTTAC 


ATGTCGTTTT 


5040 


ACGGTAACAA 


ATGGCACGAA 


TCAAGATGAA 


CATGCAATTA 


AATACTTTGG 


GCACTGTATT 


5100 




GACCAAACAG 


CTTTATCTC C 


AAAAGTTAAA 


GGTCAATTGA 


AACAGAAAAA 


GCTTATTATG 


5160 


45 


TCTGGAAAAG 


TATTAAAAGT 


AATGGTATCA 


AATGACATTG 


AACGTAATCA 


TTTTGATAAG 


5220 


GCATGTAATG 


GAAGTCTTAT 


CAAAGCGTTT 


AGAAATTGTG 


GTTTTGATAT 


CGATAAAATC 


5280 




ATATTOGAAA 


CAAATGATAA 


TGATCAAGAA 


CAAAACTTAG 


CTTCTTTAGA 


AgCACaTATT 


5340 


50 


CAAGAAGAAG 


ACGAACAAAG 


TGCACGATTG 


GCAACAGAGA 


AACTTGAAAA 


AATGAAAGCT 


5400 




GAAAAAGCGA 


AACAACAAGA 


TAACAACGAA 


AGTGCTGTCG 


ATAAGTGTCA 


AATTGGTAAG 


5460 
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GCAATAGAGG GTGTCATTTT TGATATAAAC 
GTAGAAATTA AAGTGACTGA CTATACGGAC 
5 AACAAAGATG ATTTAGAACA TTTTAAAGCG 

GGTCGTATTG AAGAAGATAC ATTTATTAGA 
GAGATTAAAA AAGCGACAAA AAAAGATAAG 

10 

CATACTGCAA TGAGCCAAAT GGATGOTATA 
GCAGACTGGG GACATCCAGC CATTGCGGTT 
GATGCTCACG CAGCAGCGGA AAAACATGGC 

1$ 

TTAGTTCATG ATGGTGTTCC GATTGCATAC 
ACTTATGTTG TGTTCGACGT TGAGACAACT 

2Q GAGCTTGCAG CTGTGAAAGT TCATAACGGT 

AATCCGCATG AACGATTATC GGAAACGATT 
TTAGTAGATG CCCCTGAGAT TGAAGAAGTA 

25 GCGATATTCG TAGCGCATAA TGCTTCGTTT 

CGTCTTGGGT TTGGACCATC AACGAATGGT 
ATTAATACTG AATATGGTAA ACATGGTTTG 

30 TTAACGCAAC ATCACCGTGC CATTTATGAT 

ATGGTTCAAC AAATGAAAGA ATTAGGCGTA 
AGTAATGAAG ATGCATATAA ACGTGCAAGA 

55 CAACAAGGTC TTAAAAATCT ATTTAAAATT 

CGTAGACCTC GAATTCCACG TTCATTGTTA 
ACAGCGTGTG ATGAAGGTGA ATTATTTACG 

40 

GAAAAAATTG C CAAAT ATT A TGATTTTATT 
TTAATTGATA GAGAGCTTAT TAGAGATACT 
ATACATGCAG GTGACACAGC GGGTATACCT 

45 

TTTGAACATG ATGGTATCG C ACGTAAAATT 
AATCGCTCAA CTTTACCGGA AGCACATTTT 
60 CATTTTTTAG GTGAAGAAAA AGCGCATGAA 

GATCGAATTG AACGTGTTGT TCCTATTAAA 



TTAAAAGAAC TTAAAAGTGO TCGCCATATC 5580 

TCTTTAGTTT TAAAAATGTT TACTCGTAAA 5640 

CTAAGTGTTG GTAAATGGGT TAGGGCTCAA 5700 

GATTTAGTTA TGATGATGTC TGATATTGAA 5760 

GCTGAAGAAA AGCGTGTAGA ATTCCACTTG 5820 

CCCAATATTG GTGCGTATGT TAAACAGGCA 58 80 

ACAGACCATA ATGTTGTGCA AGCATTTCCA 5940 

ATTAAAATGA TATACGGTAT GGAAGGTATG 6000 

AAACCACAAG ATGTCGTATT AAAAGATGCT 6060 

GGTTTATCAA ATCAGTATGA TAAAATCATC 6120 

GAAATCATCG ATAAGTTTGA AAGGTTTAGT 6180 

ATCAATTTGA CGCATATTAC TGATGATATG 6240 

CTTACAGAGT TTAAAGAATG GGTTGQCGAT 6300 

GATATGGGCT TCATCGATAC GGGATATGAA 6360 

GTTATCGATA CTTTAGAATT ATCTCGTACG 6420 

AATTTCTTGG CTAAAAAATA TGGCGTAGAA 64 80 

ACAGAAGCAA CAGCTTACAT TTTCATAAAA 6540 

TTAAATCATA ACGAAATCAA CAAAAAACTC 6600 

CCTAGTCATG TCACATTAAT TGTACAAAAC 666 0 

GTAAGTG CAT CATTGGTGAA GTATTTCTAC 6720 

GATGAATATC GTGAGGGATT ATTGGTAGGT 678 0 

GCAGTTATGC AGAAGGACCA GAGT CAAGTT 6840 

GAAATTCAAC CACCGGCACT TTATCAAGAT 6900 

GAAACATTAC ATGAAATTTA TCAACGTTTA 6960 

GTTATTGCGA CAGGAAATGC ACACTATTTG 7020 

TTAATAGCAT CACAACCCGG CAATCCACTT 7 080 

AGAACTACAG ATGAAATGTT AAACGAGTTT 7140 

ATTGTTGTGA AAAATACAAA CGAATTAGCA 7200 

GATGAATTAT ACACACCGCG TATGGAAGGT 726 0 
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CTGCCTCAAA TCGTAATTGA TCOATTAGAA 

TTTGCGGTAA TTTACTTAAT TTCGCAACGT 

5 

TTAGTTGGTT CCCGTGGTTC AGTAGGTTCT 

GAAGTAAACC OGTTACOGCC ACACTATATT 

AATGATGGTT CAGTAGGATC AGGATTTGAT 

10 

GCGCCACTTA TTAAAGAAGG ACAAGATATT 
GATAAAGTTC CTGATATCGA CTTAAACTTT 
TACACAAAAG TATTATTTGG TGAGGATAAA 

1S 

GCTGAAAAGA CTGCTTTTGG TTATGTTAAA 
AGAGGTGCTG AAATAGATCG ACTCGTTAAA 

2 0 CAGCATCCAG GGGGTATTAT TGTAGTACCT 

ATACAATATC CTGCCGATGA TCAAAATTCA 
TCTATTCATG ATAATGTATT AAAACTTGAT 

25 CGTATGCTTC AAGATTTATC AGGAATTGAT 

GTTATGCAGA TATTTAGTAC ACCTGAAAGT 
AAAACAGGTA CATTTGGGGT ACCAGAATTC 

30 GATACAAAGC CAACAACATT TTCTGAATTA 

GATGTGTGGT TAGGCAATGC TCAAGAATTA 
GTAATTGGTT GTCGTGATGA TATCATGGTT 

55 ATGGCTTTTA AAATAATGGA GTCAGTACGT 

GAAA6GATGA AAGAAAATGA AGTG CCAGAT 
TACATGTTCC CTAAAGCCCA TGCAGCAGCA 

40 

TTCAAAGTAC ATCATCCACT TTATTACTAT 
TTTGATTTAA TCACGATGAT TAAAGATAAA 
TATTCTCGCT ATATGGATCT AGGTAAAAAA 

45 

ATGAATGAAA TGGCGCATCG AGGTTATCGA 
GCGTTCGAAT TTATCATTGA AGGCGATACA 
SO CTTGGCGAAA ACGTTGCGAA ACGAATTGTT 

AAAGAAGATT TAAACAAAAA AGCTGGATTA 

55 



AAAGAATTAA AAAGTATTAT 


CGGTAATGGA 


7380 


TTAGTTAAAA AATCATTAGA 


TGATGGATAC 


7440 


AGTTTTGTAG 


CGACAATGAC 


TGAGATTACT 


7500 


TGTCCGAACT 


GTAAAACGAG 


TGAATTTTTC 


7560 


TTACCTGATA AGACGTGTGA AACTTGTGGA 


7620 


C*C\ i'i~i~i^Z 21 A A 
vj x x xyxnnrx 




*\l X lrv\\j\r\xr\ 


7680 






TW- C L-AxAAC 


7740 


GTATTC CGTG 


CAGGTACAAT 


TGGTACTGTT 


7800 


GGTTATTTGA 


ATGATCAAGG 


TATCCACAAA 


7860 


GGATGTACAG 


GTGTTAAACG 


TACAACTGGA 


7920 


GATTACATGG 


ATATTTATGA 


TTTTACGCCG 


7980 


GCATGGATGA 


CGACACATTT 


TGATTTCCAT 


B040 


ATACTTGGAC 


ACGATGATCC 


AACAATGATT 


8100 


CCAAAAACAA 


TACCTGTAGA 


TGATAAAGAA 


8160 


TTGGGTGTTA 


CTGAAGATGA 


AATTTTATGT 


8220 


liOi AL-AtyvjAx 


TCGTGCGTCA 


AATGTTAGAA 


8280 




CAGGATTATC -TCATGGTACA 


8340 




GTATATGTGA 


TTTATCAAGT 


8400 




ATGCTGGTTT 


AGAACCATCA 


8460 


AAAGGTAAAG 


GTTTAACTGA AGAAATGATT 


8520 


TGGTATTTAG 


ATTCATGTCT 


TAAAATTAAG 


8580 


TACGTTTTAA 


TGGCAGTACG 


TATCGCATAT 


8640 


GCATCTTACT 


TTACAATTCG 


TGCGTCAGAC 


8700 


ACAAGCATTC 


GAAATACTGT AAAAGACATG 


8760 


GAAAAAGACG 


TATTAACAGT 


CTTGGAAATT 


8820 


ATGCAACCGA 


TTAGTTTAGA 


AAAGAGTCAG 


8880 


CTTATTCCGC 


CGTTCATATC 


AGTGCCTGGG 


8940 


GAAGCTCGTG 


ACGATGGCCC 


ATTTTTATCA 


9000 


TCTCAGAAAA 


TTATTGAGTA 


TTTAGATGAG 


9060 



805 



EP0 766 519 A2 



GAAATAATCA AGGTATTTAT TTAATGCOTA TOGCGTAOTC AAAGAAATAC AAAATTOTTG 9180 

CTGGACACAA AATTATGCCC GTATTTCTTT TCAATGTCTT ACGAGTCTAT TCAAATGTAA 9240 

5 TGGTGAAATA AAGGAACAAA CTTTTACAAG AATCTCTGAT TAATAGTGAA GTCATTTGTT 9300 

TCAAGCATAA ACTTATGCTA TAATTAAGTT GCTTAAAAAT TAGTGAACTC AGGCAGAAGA 9360 

GTGGGAGATT CCCGCTCTTT TCTATTTGCC AAAAAGGGAG GCCTGTATGA GTAAAATTAC 9420 

10 

AGAACAAGTA GAAGTGATTG TTAAACCAAT TATGGAAGAC TTGAATTTTG AACTTGTAGA 9480 

CQTTGAATAT GTCAAAGAGG GTAGAGATCA TTTTCTTAGA ATCTCTATTG ATAAAGAAGG 9540 

TGGCGTAGAT TTAAATGATT GTAOGCTAGC TTCTGAAAAA ATAAGTGAAG CTATGGATGC 9600 

15 

AAATGATCCT ATTCCTGAAA TGTATTATTT AGACGTAGCG TCACCTGOTG CAGAACGTCC 9660 

AATTAAAAAA GAACAAGATT TCCAAAATGC AATAACTAAA CCTGTATTTG TTTCTTTATA 9720 

2Q TGTACCAATT GAAGGTGAAA AGGAATGGTT AGGCATTTTA CAAGAAGTCA ATAATGAAAC 9780 

AATTGTAGTA CAAGTTAAAA TCAAAGCAAG AACGAAAGAT ATAGAGATAC CGAGAGACAA 9840 

AATAGCAAAA GCACGTCACG CAGTTATGAT TTAACGTGAT GAGGAGGAAA AAACGTGTCA 9900 

25 AGTAATGAAT T ATT ATT AG C TACTGAGTAT TTAGAAAAAG AAAAGAAGAT TCCTAGAGCA 9960 

GTATTAATTG ATGCTATTGA AG CAGCTTTA ATTACTGCAT ACAAAAAGAA TTATGATAGT 10020 

GCAAGAAATG TCCGTGTGGA ATTAAATATG GATCAAGGTA CTTTCAAAGT TATCGCTCGT 10080 

30 AAAGATGTTG TTGAAGAAGT ATTTGACGAC AGAGATGAAG TGGATTTAAG TACAGCGCTT 10140 

GTTAAAAACC CTGCATATGA AATTGGTGAT ATATACGAAG AAGATGTAAC AC CTAAAGAT 10200 

TTTGGTCGTG TAGGTGCTCA AGCAGCGAAA CAAGCAGTAA TGCAACGTCT TCGTGATGCT 10260 

55 GAACGTGAAA TTTTATTTGA AGAATTTATA GACAAAOAAG AAGACATACT TACTGGAATT 10320 

ATTGACCGTG TTGACCATCG TTATGTATAT GTGAATTTAG GTCGTATCGA AGCTGTTTTA 10380 

TCTGAAGCAG AAAGAAGTCC TAACGAAAAA TATATTCCTA ACGAACGTAT CAAAGTATAT 10440 

40 

GTTAACAAAG TGGAACAAAC GACAAAAGGT CCTCAAATCT ATGTTTCTCG TAGCCATCCA 10500 

GGTTTATTAA AACGTTTATT TGAACAAGAA GTTCCAGAAA TTTACGATGG TACTGTAATT 10560 

GTTAAATCAG TAGCACGTGA AGCTGGCGAT CGCTCTAAAA TTAGTGTCTT CTCTGAAAAC 10620 

45 

AATGATATAG ATGCTGTTGG TGCATGTGTT GGTGCTAAAG GCGCACGTGT TGAAGCTGTT 10680 

GTTGAAGAGC TAGGTGGTGA AAAAATCGAC ATCGTTCAAT GGAATGAAGA TCCAAAAGTA 10740 

60 TTTGTAAAAA ATGCTTTAAG CCCTTCTCAA GTTTTAGAAG TTATTGTTGA TGAAACAAAT 10800 

CAATCTACAG TAGTTGTTGT TCCTGATTAT CAATTGTCAT TAGCGATTGG TAAAAGAGGA 10860 
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25 



30 



40 



45 



50 



GATGCGCGTG AAGCGGGTAT CTATCCAGTA GTTGAAGCTG 
GTTGCTTTAG AAGATGCTGA CACAACAGAA TCAACCGAAG 
GAAACAAATG TAGAGAAAGA ATCTGAATAA TAGGTTGGAG 
AAAAAATTCC GATGCGAAAA TGTATTCTTT CAAATGAAAT 
TTCGTGTTGT TGTTAATAAA GAAGGCGAAA TCTTTGCGGA 
GCCGTGGCGC ATATGTTTCT AAAGATGTTG CTATGGTTGA 
TTTTAGAAAA ATATTTTAAA GCATCTAAAG AGCAATTGGA 
TTAGATTAAT TTATAGAGAA GAGATCCCAA AATGAGTATA 
AGGATTAGCA ATGAGAGCTG GTAAAGTAAA AACAGGTGAA 
TAAAAAAGGA AATTTGAAGC TCGTTATTGT TGCAAATGAT 
ATTAATTACA GATAAATGTA AGAGTTACAA AGTTCCATTC 
TOAATTGGGA ATAGCACTTG GAAAAGGTGA GCGTGTTAAT 
CTTTGCTAAA AAGTTGCTAT CAATGATAGA TGAATATCAT 
AACAAAGAAT TTACGAATAT GCGAAAGAAT TAAATCTAAA 
AGTTAAAAAG CATGAATATT GAGGTTTCAA ATCATATGCA 
TTAAAGCATT AGATAAAAAG TTCAAAAAAG AACAAAAGAA 
AAAATAATCA CCAAAAATCA AACAATCAAA ACCAAAATAA 
AAAAGAATCm ACAACAAAAT AATAAAGGCA ACAAAGGCAA 
ATAAGAAAAA TAACAAGAAT AATAAACCAC AAAATCAACC 
CATCAAAAGT GACATATCAA GAAGGTATTA CAGTAGGCGA 
TTGAATCATC AGAAATTATC AAAAAATTAT TCTTACTTGG 
AATCATTAAA TCAAGAAACA ATCGAATTAA TTGCCGATGA 
AAGAAGTTGT GATTAATGAA GAAGACTTAT CAATCTATTT 
CAGAGGCAAT TGAGAGACCA GCAGTTGTAA CAATTATGGG 
CGACTTTATT AGATTCAATT CGTCATACAA AAGTTACAGC 
CTCAACATAT TGGTGCATAT CAAATTGAAA ACGATGGCAA 
CACCGGGACA TGCTGCATTT ACAACGATGC GTGCGCGTGG 
CTATTTTAGT AGTAGCAGCT GACGATGGTG TTATGCCACA 
ATGCTAAAOA AGCAgAAGTA CCAATTATTG TTGCAGTAAA 



AAAAAGTAAC TGAAGAAGAT 10980 

AGGTAAATGA TGTTTCAGTT 11040 

TGAAGTATCT ATGAAAAAGA 11100 

GCATCCCAAA AAAGATATGA 11160 

TGTTACTGGA AAGAAACAAG 11220 

AAAAGCACAA CAAAAAGAAA 11280 

TCCTGTTTAC AAAGAAATTA 11340 

GATCAAATAT TAAACTTTTT 11400 

TCAGTCATTG TTAATGAGAT 11460 

GCGTCTGATA ATACAGCTAA 11520 

AGAAAGTTTG GAAATCGAAA 11580 

GTAGGGATTA CTGACCCAGG 11640 

AAGGAGTGAT TATATGAGTA 11700 

GAGTAAAGAG ATTATAGATG 11760 

AGCTTTGGAA GATGACCAAA 11B20 

CGACAATAAA CAAAGCACTC 11880 

AGGGCmACAA AAAGATAACA 11940 

TAAAAAGAAT AATAGAAATa 12000 

AGCTGCTCCA AAAGAAATAC 12060 

ATTTGCGGAT AAATTAAATG 12120 

TATTGTTGCT AATATCAATC 12180 

TTATGGCGTT GAGGTTGAAG 12240 

CGAAGACGAA AAAGATGATC 12300 

ACATGTTGAC CATGGTAAAA 12360 

AGGTGAAGCA GGCGGAATCA 12420 

AAAAATCACT TTCTTAGATA 124 80 

TGC a CAAGTA ACAGATATTA 12540 

AACAATTGAA GCAATTAACC 12600 

TAAAATTGAT AAACCAACTT 12660 
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GCGGCGAAAC AATTtTCGTc CACTTTCTGC 
AGAAATGATA GGATTAGTTG CAGAAGTTCA 
5 TGTTGGTACA GTTATCGAAG CTGAATTAGA 

AGTACAAAAC GGTACATTAA ATGTTGGTGA 
TATCCGTGCA ATGGTTAATG ACTTAGGTCA 

10 

TGTTGAAATT ACAGGTATTA ATGATGTGCC 
TGATGAAAAA CAAGCTCGTC GTATTGGTGA 
ACGTCAAGAA AGTAAAAATG TTTCATTAGA 

15 

AATGAAAGAT TTAAACGTTA TTATTAAAGG 
TGCATCATTA ATGAAAATTG ATGTTGAAGG 

2Q TGGTGCAATT AATGAGTCAG ACGTGACACT 

TTTCAATGTT CGTCCAGACA GTGGTGCAAA 
GCGTTTACAC AGAGTTATTT ATAATGTTAT 

25 ACTTGATCCA GAATTTGAAG AACAAGTTAT 

AGTTTCTAAA GTTGGTACTA TTGCTGGATG 
TGCTGGTGTA CGTATTATTC GTGATGGTAT 

30 TAAACGTTTC AAAGATGATG CTAAGGAAGT 

TGAAAACTAC AATGACCTTA AAGAAGGCGA 
TAAGCGTTAA TTAAATAAAT TACAAGCTAA 

35 AAATATTGCA CTTTTTAAGT GTCTACTTTA 

TTTTTATTAG AATAGATTAC CTATTAAAAG 
ATTTTGTGGT GGCCTAGAAT GATTTTTAAT 

40 

AATTTTCTGT TGaAATGCCT ATCTTACGGC 
ATTAAAATAA CGTGTGAGCT AAAATAATTG 
TAACAATTGA ACTTAAAGAT AAAGAGGTGA 

45 

TTGGTGAACA AATGAAGAAG GAATTAATGG 
GAGTTGGTTT TATTACAATT ACAGATGTTG 
60 TATTTTTAAC TGTATTAGGT AACGATAAAG 

AAGCAAAAGG CTTCATTAAG TCTGAATTAG 

65 



ATTAAGTGGT 


GATGGTATCG 


ACGATTTATT 


12780 


AGAACTTAAA 


GCAAATCCTA 


AAAACCGTGC 


12840 


TAAATCACGT 


GGTCCTTCTG 


CATCATTATT 


12900 


TGCGATTGTA 


GTTGGTAATA 


CTTACGGCCG 


12960 


AAGAATCAAA 


ACGGCTGGTC 


CATCAACGCC 


13020 


ACAAGCTGGG 


GATCGCTTTG 


TTGTATTTAG 


13080 


ATCAAGACAC 


GAAGCTAGCA 


TTATACAACA 


13140 


TAACCTGTTT 


GAACAAATGA 


AACAAGGTGA 


13200 


TGATGTTCAA 


GGTTCTGTTG 


AAGCTTTAGC 


13260 


CGTAAATGTT 


CGTATCATTC 


ATACAGCGGT 


13320 


TGCTAATGCC 


TCAAATGGTA 


TTATCATTGG 


13380 


ACGTGCTGCA 


GAAGCTGAAA 


ATGTTGATAT 


13440 


CGAAGAAATT 


GAATCAGCGA 


TGAAAGGTTT 


13500 


CGGACAAGCT 


GAAGTTCGTC 


AAACATTCAA 


13560 


TTATGTTACT 


GAAGGTAAAA 


TTACGCGAAA 


13620 


TGTTCAATAT 


GAAGGCGAAT 


TAGATACACT 


13680 


TGCAAAAGGT 


TATGAATGTG 


GTATTACAAy 


13740 


TGTTATCGAA 


GCATTTGAAA 


TGGTTGAAAT 


13800 


AAGTATAGTT 


AAGATTGATA 


TGCTCCCTAT 


13860 


TAGGGAGCAT 


ATTTGATACT 


AGCTTTTGGT 


13920 


TTACGTTATA 


TGGACATGAT 


TTTGTATAAA 


13980 


GACAAAATAT 


AATGTCGACT 


ATTATTGGAA 


14040 


AAACTTTATT 


TGATTTTATA 


GGCTTAATTT 


14100 


TTTAAGCATT 


GTTACACTAA 


AAAATGCAAA 


14160 


CAAGAATGAG 


CAGTATGAGA 


GCAGAGCGTG 


14220 


ATATCATCAA 


CAATAAAGTC 


AAAGATCCTC 


14280 


TTTTAACAAA 


TGATTTATCG 


CAGGCTAAAG 


14340 


AAGTAGAAAA 


TACATTTAAA 


GCACTTGATA 


14400 


GTTCTAGAAT 


GCGATTACGT 


ATTATGCCGG 


14460 
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AAGATTTACA CAAACAAGAT AGATAATTTA 
TTCTTAATAT CGGTATATTA ACATTAAACA 
5 CATTTTCCAG T TTTTT TATG AATAAATTTA 

AAGAAGGTGA CTATATGTAT AATGGGATAT 
GTCATGACGT TGTATTCAAA TTGCOTAAAA 

10 

GTACGCTTGA TCCCGAAGTT GCAGGCGTGT 
TTAGTGATTA TGTTATGGAT ATGGGCAAAG 
GTACAACX3AC TGAAGATCAA ACGGGTGATA 

IS, 

ATTTTAATAA GGAOGATATT GACCGATTGT 
TTCCGCCGAT GTACTCATCC GTCAAAGTAA 

2Q ATAATGAAAC AGTTGAAAGA CCAAAGCGTA 

CTGAATTAGA TTTTAAAGAA AATGAGTGTC 
GTACATATAT TAGAACGCTA GCAACTGATA 

25 TGTCGAAATT AACACGAATC GAGTCTGGTG 

AACAAATAAA AGAACTTCAT GAGCAGGATT 
ATGGATTAAA GGGTTTGCCA AGCATTAAAA 

30 TAAATGGGCA GAAATTTAAT AAAAATGAAT 

TTATTGATGA TGATTCAGAA AAAGTATTAG 
CAGAAATTAA ACCTAAAAAA GTCTTTAATT 

33 AG t G ACACAT CCTATACAAT CTAAACAGTA 

ATTPTTCGAT GGCATGCATA AAGGTCATGA 
TGAGGCACGC AGTTTAAAAA AAGCGGTGAT 

40 

GAATCCTAAA AGAAAACGAA CAACGTATTT 
TAGCCAACAT GATATTGATT ATTGTATAGT 
GAGCGTAGAA GATTTTGTTG AAAATTATAT 

45 

TGGTTTTGAT TTTACTTTTG GTAAATTTGG 
TGATGCGTTT AATAOGACAA TTGTGAGTAA 
SQ AACTTCTATT CGTCAAGATT TAATCAATGG 

CTATATATAT TCTATTAAAG kCACTGTAGT 



GTGTTAGGTA TCTGGAAAAT GTTTGATAAT 14580 

GTTAATACAT AGATGTGTAG AAATAGTTAA 14640 

GTTGATACGC TATTAAAATA TATTTTAAAA 14700 

TACCAGTATA TAAAGAGCGC GGTTTAACAA 14760 

TATTAAAAAC TAAAAAAATA GGTCACACGG 14820 

TACCGGTATG TATAGGTAAT GCAACGAGAG 14680 

CTTATGAAGC AACTGTATCG ATAGGAAGAA 14 940 

CATTGGAAAC AAAAGGTGTA CACTCAGCAG 15000 

TAGAAAGTTT TAAAGGTATC ATTGAACAAA 15060 

ATGGTAAAAA ATTATATGAA TATGCGCGTA 15120 

AAGTtAATAT TAAAGACATT GGGCGTATAT 15180 

ATTTTAAAAT ACGCGTCATC TGTGGTAAAG 15240 

TTGGTGTGAA ATTAGGCTTT CCGGCACATA 15300 

GATTTGTGTT GAAAGATAGC CTTACATTAG 15360 

CATTGCAAAA TAAATTGTTT CCTTTAGAAT 15420 

TTAAAGATTC GCACATAAAA AAACGTATTT 154 80 

TTGATAACAA AATTAAAGAC CAAATTGTAT 15540 

CAATTTATAT GGTACACCCT ACAAAAGAAT 15600 

AAAGGAGATA GAATTTATGA AAGTCATAGA 15660 

TATTACAGAG GATGTTGCAA TGGCATTCGG 1572 0 

CAAAGTCTTT GATATATTAA ACGAAATAGC 15780 

GACATTTGAT CCGCATCOGT CTGTCGTGTT 1584 0 

AACGCCACTT TCAGATAAAA TCGAAAAAAT 15900 

GGTTAATTTT TCATCTAGGT TTGCTAATGT 15960 

AATTAAAAAT AATGTAAAAG AAGTCATTGC 16020 

AAAAGGTAAT ATGACTGTAC TTCAAGAATA 16080 

ACAAGAAATT GAAAATGAAA AAATTTCTAC 16140 

TGAGTTGCAA AAAGCGAATG ATGCTTTAGG 16200 

GCAAGGTGAA AAAAGGGGAA GAACTATTGG 16260 
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TGCTGTTAGT 
TGTAAAGCCA 
TGACTTTGAG 
TCCTGAGATT 
GCGTGCTAAA 
TTGCGTATAG 
ACGCCTAACT 
TTCACAAGAA 
TTCACCAGAA 
ACGTACACAC 
TAGcATTTaT 
TCACTTGGTA 
TCCAACCTTA 
GCTAATATTG 
GTAATAATCA 
ACTGATAAGG 
TTTTTTCCAA 
. AACTATTAGA 
. GAATGGGCAG 
GCTGTATTGG 
CCTCGTGATG 
GGTAAAATTC 
ACTGCGCGAT 
GTTCAAATTA 
ATGATTGGTT 
GGTGTAAATG 
GAAGTTTCTC 
GCAGGCGCTA 
GAGATTCAAC 



ATTGAAATCG 
ACATTTCATG 
GATAATATTT 
AAATTTGATG 
TATTTATTAG 
tTATATAAAC 
CGGATTAAGG 
CGTAAAAACG 
GTACAAATCG 
AAAAAAGACC 
TAAACTACTT 
TCCGTCGTTA 
ATTTATATTA 
AGTGAATAAT 
AGATATTAAA 
GTGGGACGAT 
TTCAATATTT 
TTCAAGAGAG 
GAAGATCTTT 
TTCGTTATGG 
GAGATTTCTT 
CTGGTGGATT 
TAATTGATAG 
TGAACATGGT 
CATCTATGGC 
TGGGTTATAT 
GTTTAGACCT 
GTGAGATTAC 
GTTTAGTTGA 



GCACTGAAAA 
ATCCTAACAA 
ATGGTGAACQ 
GTATCGACCC 
CAGTTGATTT 
AATCTATACC 
AGTATTCAAA 
AAATCATTAA 
CTGTACTTAC 
ACCATTCACG 
ACGTaGTAAA 
ATCTTAATAT 
AAAAAGCTTT 
AAGGTTACAA 
AATAAAGTAT 
AAGTCTATTT 
TATAACTAAT 
GAGATTTATA 
AACGATTGAA 
AGATACAGTC 
CCCATTAACA 
TAAAAAGAGA 
ACCAATTAGA 
ATTAAGTGCA 
GCTTAGTGTG 
TGACGGTAAA 
TGAAGTAGCT 
TGAACAAGAA 
TTTCCAACAA 



TAAATTATAT 
AGCAGAAGTT 
AGTGACCGTG 
ATTAGTTAAA 
TGGTGATGAA 
ACACCTTTTT 
CATTTTAAGG 
AGAATACCGT 
TGCAGAAATC 
TCGTGGATTA 
GATATTCAAC 
AACGTCTTTG 
TTACAAATAT 
TGAGATAAAG 
GTTTTTTTAA 
TGTAAATAAT 
ATTAAAATAC 
ATGTCTCAAG 
ACAGGGCAAT 
GTGTTATCGA 
GTGAACTATG 
GAAGGACGTC 
CCTTTATTCC 
GATCCTGATT 
TCGGATATTC 
TATATCATTA 
GGTCATAAAG 
ATGTTAGAGG 
CAAATCGTCG 



CGAGGGGTAG 
GTCATCGAAG 
AATTGGCATC 
CAAATGAACG 
GTAGCTTATA 
CTTAGTAGGT 
AGGAAATTGA 
GTAGACGAAA 
AACGCaGTAA 
TTAAAAATGG 
GTTACCGTGA 
AGGTTGGGGC 
TAACATTTAT 
ATGATATAAG 
AAAATATAAC 
AGATGGATAT 
GATAATAAAT 
AAAAGAAAGT 
TAGCTAAACA 
CGGCAACTGC 
AAGAAAAAAT 
CTGGTGACGA 
CTAAAGGATA 
GTTCACCACA 
CATTCCAAGG 
ACCCAACAGT 
ATGCGGTAAA 
CGATTTTCTT 
ACCACATTCA 



CTAACATAGG 
TGAATATCTT 
ATTTCTTACG 
ATGATAAATC 
ATATCTAGAG 
CGAATCTCCA 
TTATGGCAAT 
CTGATACTGG 
ACGAACACTT 
TAGGTCGTCG 
ATTAATTAAA 
ATATTTATGT 
TATATGTTAA 
TACACCTAGA 
TTATATTTAT 
CCCGCTCTCT 
GATATGATAT 
TTTTAAAACT 
AG CAAATGG C 
ATCAAAAGAA 
GTACGCTGCG 
TGCAACATTA 
TAAG CATGAT 
AATGGCTGCA 
GCCAATCGCC 
AGAAGAAAAA 
CATGGTAGAG 
TGGTCATGAA 
ACCTGTTAAA 



16380 
16440 
16500 
16560 
16620 
16680 
16740 
16800 
16860 
16920 
16980 
17040 
17100 
17160 
17220 
172B0 
17340 
17400 
17460 
17520 
17580 
17640 
17700 
17760 
17820 
17880 
17940 
18000 
18060 
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20 



25 



30 



35 



40 



45 



SO 



GAAGAAAAAG GACTTAAAGA AACAGTTTTA ACATTTGATA 
CTTGATAACT TAAAAGAAGA AATCGTCAAT GAATTTATCG 
GAaTTACTTA TTAAAOAAQT TTATGCAATT TTAAATGAAT 
CGTTTAATTG CAGATGAAAA AATTAGACCA GACGGCCGTA 
TTAGATTCTG AAGTTGGTAT TTTACCTAGA ACGCATGGTT 
CAGACTCAAG CACTTTCAGT TTTAACATTA GGTGCTTTAG 
GGTTTAGGAC CTGAAGAAGA AAAAAGATTC ATGCATCATT 
GTAGGTGAAA CTGGTCCAGT ACGTGCGCCA GGTCGTCGTG 
GGTGAAAGAG CATTAAAATA TATTATTCCT GATACTGCTG 
ATTGTAAGTG AGGTACTTGA ATCAAATGGT TCATCATCTC 
ACATTAGCAT TAATGGATGC GGGCGTACCG ATTAAAGCAC 
GGCCTTGTTA CACGTGAAGA TAGCTATACG ATTTTAACTG 
GCATTAGGTG ATATGGACTT TAAAGTCGCT GGTACTAAAG 
ATGGATATTA AAATTGACGG TTTAACGCGT GAAATTATCG 
AGACGTGGTC GTTTAGAAAT AATGAATCAT ATGTTACAAA 
GAATTAAGTG cTTACGCGCC AAAAGTTGTA ACTATGACAA 
GATGTTATCG GACCTGGTGG TAAAAAAATT AACGAAATTA 
TTAGATATTG AACAAGATGG TACTATCTTT ATTGGTGCTG 
CGTGCTCGTG AAATCATTGA GGAAATTACA CGTGAAGCGG 
GCCACTGTTA AACGTATTGA AAAATACGGT GCGTTTGTAG 
GCGTTGCTTC ACATTTCACA AATTTCAAAA AATAGAATTG 
AAAATCGGTG ACACAATTGA AGTTAAGATT ACTGAAATTG 
GCTTCACATA GAGCATTAGA AGAATAATAT TTAAAGTCAT 
TGTGATTTTT TTATGCCACT TTTTACGAAG TGACCCGTTT 
TTTTAAAACG CTTTATTATT TTGTGTGCAA CTGTTAATTA 
ATAGTGTACA TCAAGTGTTT TTTAACTTAT AATGAATAGT 
AACAAATTTA GGAGGTAAGA TTTTGAGTTT AATAAAGAAA 
TATACCATTA GGCGGTGTTG GCGAAATTGC TAAAAATATG 
TGAAATGTTT ATGTTAGATG CTGGACTTAT GTTT CCAGAA 



AACAACAACG AGATGaAAAT 18180 

ATGAAGAAGA TCCAGAGAAT 18240 

TAGTGAAAGA AGAAGTTCGA 18300 

AACCTGATGA AATCCGTCCA 18360 

CAGGTCTATT TACACGTGGT 18420 

GCGATTATCA ATTAATTGAT 18480 

ACAACTTCCC GAATTTTTCA 18540 

AAATTGGACA TGGTGCGTTA 18600 

ATTTCCCATA TACAATTCGT 18660 

AAG CGTCAAT TTGTGGATCA 18720 

CAGTTGCTGG TATTGCTATG 18780 

ATATCCAAGG TATGGAAGAT 18840 

AAGGTATTAC AGCAATCCAA 18900 

AAGAGGCTCT AGAACAAGCG 18960 

CAATTGATCA ACCACGTACT 19020 

TTAAACCAGA TAAGATTAGA 19080 

TTGATGAAAC AGGTGTTAAA 19140 

TTGATCAAGC TATGATAAAT 19200 

AAGTAGGTCA AACTTATCAA 19260 

GCCTATTCCC AGGTAAAGAT 19320 

AAAAAGTGGA AGATGTATTA 19380 

ATAAAGAAGG TCGAGTAAAT 19440 

ATGACGACAA TGTATCGTCA 19500 

TGAATTTGTT GTATTGAACA 19560 

TCCTGTATGT ATAGTGATTA 19620 

GAGTTTATAT ATGGACGGGT 19680 

AAGAATAAAG ATATTCGCAT 19740 

TATATCGTTG AAGTAGACGA 19800 

GACGAAATGC TAGGTATTGA 19860 
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CCTTACACAC GGACATGAGC ACGCGATTGG 


TGCAGTGAGT 


TATGTTTTAG 


AACAATTAGA 


1 Q Qpn 




TGCACCAGTA TATGGATCTA AATTGACAAT AGCGTTAATT AAAGAAAATA TGAAAGCCCG 


A \J U4 KJ 


5 


TAATATTGAT AAAAAAGTTC 


GCTACTATAC 


AGTTAATAAT 


GATTCAATTA 


TGAGATTCAA 






AAACGTGAAT ATTAGTTTCT 


TTAATACGAC 


ACACAGTATT 


CCTGATAGTT 


TAGGTGTTTG 




10 


TATTCACACT TCATATGGTG 


CCATTGTGTA 


TACAGGTGAA 


TTTAAGTTTG 


ACCAAAGTTT 




ACATGGACAT TATGCACCAG 


ATATTAAACG 


TATGGCAGAG 


ATTGGTGAAG 


AAGGCGTATT 






TGTCTTAATC AGTGATTCTA 


CTGAGGCAGA 


GAAACCTGGA 


TATAATACTC 


CGGAAAATGT 


^ 0 J4Q 


1S 


GATTGAACAT CATATGTATG 


ATGCTTTTGC 


AAAAGTGCGA 


GGTCGCTTGA 


TAGTTTCATG 


2 04 00 




TTATOCTTCG AACTTTATAC 


GTATTCAGCA 


AGTTTTAAAT 


ATTGCTAGCA 


AGCTAAATCG 


20460 




TAAAGTGTCA TTTTTAGGAA 


GATCACTTGA 


AAGTTCATTT 


AATATTGCTC 


GTAAAATGGG 


20520 


SO 


GTATTTCGAC ATTCCTAAAG 


ATTTGCTAAT 


TCCTATAACA 


GAAGTTGATA 


ATTATCCTAA 


20580 




AAATGAAGTG ATAATTATAG 


CTACTGGTAT 


GCAAGGAGAA 


CCTGTAGAAG 


CCTTAAGTCA 


20640 


25 


AATGGCGCAA CATAAGCATA 


AAATTATGAA 


TATCGAAGAA 


GGCGATTCTG 


TATTTTTAGC! 


20700 


AATTACGGCT TCTGCTAATA 


TGGAAGTTAT 


CATTGCGAAT 


AcATTAAATG 


AGCtTaTtAC 


20760 




GnCTGGCGCA CAT ATT ATT C 


CAAATAACAA 


AAAGATTCAT 


GCTTCAAGTC 


ATGGTTGCAT 


20820 


30 


GGAAGAATTA AAAATGATGA 


TTAATATTAT 


GAAACCTGAA 


TACTTTATTC 


CTGTACAAGG 


20830 




TGAATTTAAA ATGCAGATAG 


CACATGCGAA 


GCTAGCAGCT 


GAAGCAGGTG 


TTGCACCAGA 


20940 




AAAGATTTTC CTTGTGGAAA 


AAGGAGATGT 


CATTAATTAC 


AACGGTAAAG 


ATATGATATT 


21000 


35 


AAATGAAAAG GTAAATTCAG 


GAAATATTTT 


AATAGATGGC 


ATTGGTATTG 


GGGATGTAGG 


21060 




AAATATCGTG TTGAGAGACC 


GTCATCTTTT 


AGCAGAAGAT 


GGTATCTTTA 


TTGCTGTTGT 


21120 




AACOTTAGAT CCTAAAAATA 


GACGTATAGC 


TGCGGGACCT 


GAAATTCAAT 


CTCGTGGGTT 


21180 


40 


TGTATATGTA CGTGAAAGTG 


AAGACTTATT 


ACGTGAAGCA 


GAAGAGAAAG 


TACGTGAAAT 






AGTAGAGGCT GGTTTACAAC: 


AAAAAfCfAT 


Af! A ATYimVT 
1 VjO X V_ X 








45 


TGATCAAATT AGTAAACTAT 


TATTCGAAAG 


TACAAAACGT 


CGTCCTATGA 


TTATTCCAGT 


4S1JDU 


AATTTCTGAA ATTTAATCAA 


AAAGTCATTA 


ACATAAAAGA 


GGTCAGAACA 


AGTCACTGAA 


21420 




ATATAATGGT TGTCATGGAC 


AATTTACTTA 


TATTTTATGA 


TAGTCAATTG 


AAGGGGTAAC 


21480 


50 


GATTAATCTG TTATCTTAAG 


TAAATTGATA 


CATAGATGAT 


ATTGTTCTAA 


CCTCTTTCAT 


21540 




CGTCTGTTTG GACTACATAT 


TCTAAACATC 


AAATAGGAAA 


TTATATATAA 


TAACGTCGTT 


21600 




TTAACTAAGG CAACATAAGG 


AGGTGCGTCA 


ATTGGCACAA 


GCAAAAAAGA 


AATCX3ACAGC 


21660 
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20 



25 



GATACGTTAT GTCATAGCTA TTTTAGTAGT TGTATTAATG GTGTTGGGTG TTTTCCAATT 21780 

AGGAATAATA GGTCGTCTAA TTGACAGCTT CTTTAATTAT TTATTTGGGT ACAGTAGATA 21840 

TTTAACATAT ATTTTAGTAC TCTTAGCAAC TGGTTTTATT ACATACTCTA AACGTATTCC 21900 

TAmaACTAGA CGAACGGCTG GTTCGATTGT ATTGCAAATT GCATTGCTAT TTGTAT CACA 21960 

GTTAGTTTTT CATTTTAATA GTGGTATCAA AGCTGAAAGA GAACCTGTAC TTTCTTATGT 22020 

GTATCAGTCA TACCAACACA GTCATTTCCC AAATTTTGGT GGCGGTGTAT TAGGCTTTTA 22080 

TTTATTAGAG TTAAGCGTAC CTTTAATTTC ATTATTTGGT GTATGTATTA TTACTATTTT 22140 

ATTATTATGC TCAAGTGTTA TTTTATTAAC AAACCATCAA CATCGTGAAG TTGCAAAAGT 22200 

TGCACTGGAA AATATAAAAG CTTGGTTTGG TTCATTTAAT GAA 22243 

(2) INFORMATION FOR SEQ ID NO: 16S: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5510 base pairs 
<B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



30 



40 



45 



so 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 165: 

TTATTAATnA TTAATATTTT TATTTTTAAA AATAAAGCGA GGAGCTATCA ATGGAACAAA 60 

TTACTTCTGC ACAAAATAAT AGAATTAAAC AAGCGAACAA GCTAAAAmAG AAACGTGAGA 120 

GGGATAAAAC TGGATTAGCT TTAATTGAAG GTGTGCATTT AATTGAAGAA GCTTATCAAA 180 

GTGGAATTGT AATTACACAA TTATTTGCAA TTGAACCGGC AAGATTAGAT CAGCAAATTA 24 0 

WCGCATACGC GCAAGAAGTT TTTgAAATAA ACATGAAAGT TGCTGAATCT TTATCAGGTA 300 

CAGTfiACACC ACAAGGGTTT TTCGCAATCA TTGAGAAGCC GCATTATGAT ATTTCTAAAG 3 60 

CACAACAAGT ATTGCTCATC GATCGTGTTC AAGATCCTGG AAATTTAGGC ACATTAATTA 420 

GAACTGCGGA TGCTGCTGGA ATGGATGCTG TAATAATGGA GAAGGGTACG ACAGATCCTT 4 80 

ATCAAGATAA AGTGTTGCGA GCGAGTCAAG GTAGTGTTTT CCATTTGCCA GTTATGACAC 540 

AAGATCTCGA TACGTTTATT ACTCAATTTA ATGGTCCTGT TTATGGTACA GCACTTGAAA 600 

ACGCAGTGgC ATACAAAGAA GTTACTTCAA GTGATTCTTT TGCATTACTA TTAGGTAATG 660 

AGGGAGAAGG TGTTAATCCT GAATTATTAG CACATACTAC ACAAAATTTA ATCATACCTA 720 

TTTATGGTAA AGCTGAAAGT TTAAATGTAG CGATTGCAGG TAGTATTTTA CTTTATCATT 780 

TGAAAGGTTG ACCGTGTTGA AAGTTTTCCG ATATAATTAT AATTAATTGT TTAACAGAAC 84 0 
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ATAAATAATT GTTTTAGGGA OAATAATCGT 
TTTTCACCTT TTTGGTTACT TAAAGAGATT 
5 TAAACAAGTG T ATG CTT AGG CATAAATTTG 

TATTTTTTAA GAGGATGAAA GTCTTTTTTT 
TGAATAGTTC GAATAGGGAG GTCAGTGACA 

10 

AAAACAACAA GCGCTTGTAG ATATTAATGA 
TAAAGTGAAA TACTTAGGTA AAAAAGGGTC 
TTTGCCGAAT GAAGATAAAC CTGCGTTTGG 

15 

TCAAAATGAA TTAGATGAAA GACAACAGAT 
TGGcTGAAGA AACAATTGAT GTATCATTAC 

20 ATCCATTAAC ACGTACAATA GAAGAAATTG 

TTGTGAATGG ATATGAAGTT GAACAAGATC 
AATCACACCC TGCACGTGAT ATGCAAGATA 

25 GTACGCATAC ATCACCAGTG CAGGCACGTa 

, TTAAAATTAT TTGCCCTGGT AAAGTGTATC 

ATGAATTTAC ACAAATCGAA GGATTAGTTG 

30 

AAGGTACTTT AGAATTGTTA GCTAAGAAAT 

GTCCAAGTTA CTTCCCATTC ACTGAACCTT 

GTAAAGGAAA AGGTTGTAAT GTGTGTAAAC 

35 

GAATGGTACA TCCTAATGTA TTAGAAATGG 
TTGCATTTGG TATGGGACCA GACCGTATTG 

40 GTCATTTCTA TACTAATGAT GTGAGATTTT 

GTGACATGTA ATGTTGATAT CAAATGAATG 
TGTAAGTAAT TTGGCAGAAC GTATTACGCG 

45 CTACACAAAA GATATCAAAA ATTTAGTTGT 

TGATGCTGAT AAATTAAATG TTTGCCAAGT 
CGTTTGTGGT GCACCGAACG TTGaTGCAGG 

SO 

CAGATTGCCT GGTGGTATTA AAATTAAGCG 
TATGATTTGT TCGTTACAAG AAATTGGTAT 

55 
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GACTGCAAGT TATTCCAATT ATTTAAAGTC 960 

TAAGTCGGAA AGACAATCCG TTATCAATAT 1020 

GGTGGTACCA CGGAAATGAC TTTCGTCCCT 1080 

AGTTAAACAA CAAATATGAT AAATAGAAAA 1140 

TATGTCTGAA CAACAAACAA TGTCAGAGTT 1200 

AGCAAATGAT GAACGTGCAC TGCAAGAAGT 1260 

AGTTAGCGGA CTAATGAAAT TGATGAAGGA 1320 

TCAAAAAGTG AATGAATTGC GTCAAACAAT 1380 

GTTAGTTAAA GAAAAATTAA ATAAGCcAAT 1440 

CAGGTCGTCA TATTGAAATC GGTTCAAAGC 1500 

AAGACTTATT CTTAGGTTTA GGTTATGAAA 1560 

ATTATAACTT CGAAATGCTG AATTTACCTA 1620 

GTTTCTATAT TACGGATGAA ATTTTATTAC 1680 

CGATGGAATC ACGTCATGGT CAAGGTCCAG 174 0 

GTCGTGACTC TGATGATGCG ACACATAGTC 1800 

TTGATAAAAA CGTTAAAATG AGTGATTTGA 186 0 

TATTTGGTGC TGATCGTGAA ATTCGTTTAC 192 0 

CTGTAGAAGT TGATGTGTCA TGTTTTAAAT 19 80 

ACACAGGATG GATTGAAATT TTAGGTGCTG 204 0 

CTGGTTTTGA TTCTTCAGAG TACTCTGGAT 2100 

CAATGTTGAA ATATGGTATA GAAGATATTC 2160 

TAGATCAATT TAAAGCGGTA GAAGATAGAG 222 0 

GTTGAAAGAA TATGTAACAA TCGATGATTC 2280 

CACAGGTATT GAAGTGGATG ATTTAATTGA 2340 

CGGCTTCGTT AAGTCAAAAG AGAAACATCC 2400 

TGATATCGGA GAAGACGAAC CTGTACAAAT 2460 

ACAATATGTC ATTGTTGCTA AAGTAGGTGG 2520 

TGCCAAATTA CGCGGTGAAC GTTCAGAAGG 2580 

TTCAAGTAAC TATATACCGA AAAGTTTTGA 264 0 
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ATATTTAGAT GATCAAGTAA TGGAATTTGA 
TATGATAGGT ACTGCTTATG AAGTTGCAGC 
5 GACAACATCA AATGAGCTTG ATTTATCTGC 

TGAAGAXAAA GTACCATATT ATAGTGCACG 
GCCAATTTGG ATGCAAGCAC GCTTAATAAA 

10 

TGACATTTCA AATTATGTGT TATTAGAATA 
TGCGATTGGT TCACAACAAA TTGTTGTTCG 

15 ATTAGATGAT ACAGAACGTG AATTATTAAC 

TCCAATTGCA TTAGCTGGTG TTATGGGTGG 
AAATATAGTG ATTGAAGGTG CTATTTTTGA 

20 TTTAAATTTA CGCAGTGAAT CATCTAGTCG 

AGATGAAGCA GTCGACCGTG CATGTTATTT 
AAAAGATAGA GTGTCTTCAG GAGAACTTGG 

25 TGATAAAATT AATCGCACTA TTGGATTTGA 

TAATCAACTA GGGTTTGATA CAGAAATAAA 
ACGTCGTAAA GATATTACAA TTAAAGAAGA 

30 

ATACGACGAT ATTCCATCAA CGTTACCTGT 
TGATCGCCAA TATAAAACTA GAATGGTTAA 

35 AG CTATTACG TATTCGTTAG TTTCTAAAGA 

TCAAACAATT GATTTATTGA TGCCAATGAG 
ATTACCACAT TTAATCGAAG CGGCATCATA 

40 ATTATTTGAA ATCGGCAATG TCTTCTTTGC 

TGAATATTTA AGTGGTATTT TAACTGGAGA 

AGAAACGGTT GATTTCTATT TAGCAAAAGG 

45 

TCTTGAATTT AGTTATCGCC GTGCTGATAT 

AATCTTATTA GAGAATAAAG TTGTTGGTTT 

TGATAATGAT TTAAAACGTA CGTATGTTTT 

50 

GTCGGTAGGT TACATTAATT ACCAGCCAAT 
TGCATTAGAA GTAGATCAAA ATATTCCAGC 

55 



TTTAACGCOG 


AATCGTGCAG 


ATGCTTTAAG 


2760 


ATTATATAAT ACAAAAATGA 


CTAAG CCAGA 


2820 


AAATGATGAA 


CTGACTGTGA 


CAATTGAAAA 


2880 


TGTTGTTCAC GACGTGACAA 


TTGAACCCTC 


2940 


AGCGGGTATA 


CGTCCTATTA ATAATGTTGT 


3000 


CGGTCAACCA 


TTGCACATGT 


TTGATCAAGA 


3060 


TCAAGCTAAT 


GAAGGCGAAA AAATGACAAC 


3120 


GAGCGATATT 


GTCATTACTA 


ATGGACAAAC 


3180 


WWil A X, X Iwl 


GAAGTTAAAG 


AACAAACATC 


3240 


TCCAGTTTCA 


ATTCGTCATA 


CATCAAGACG 


3300 


TTTTGAAAAA 


GGAATAGCTA 


CTGAATTTGT 


3360 


ATTACAAACT 


TATGCAAACG 


GAAAAGTGCT 


3420 


TGCATTTATT 


ACACCAATCG 


ACATCACTGC 


3480 


TTTGTCACAA 


AATGATATTG 


TTACTATTTT 


3540 


TGATGATGTT 


ATTACAGTGC 


TAGTACCATC 


3600 


TTTAATTGAA 


GAAGTTGCAC 




3660 


CTTCGATAAA 


GTTACTAGTG 




3720 


AGAAGTGTTA GAAGGTGCTG 


GATTAGACCa 


3780 


AGATG CT ACT 


GCaTTTTCGA 


TGCAACAGCG 


3840 


TGAAGCGCAT 


GCGTCATTAC 


GTCAAAGTTT 


3900 


TAATGTGGCA 


CGCAAAAATA 


AAGATGTAAA 


3960 


TAATGGAGAA 


GGTGAACTAC 


CAGATCAAGT 


4020 


TTATGTAGTC 


AATCAATGGC 


AAGGTAAGAA 


4080 


TGTOGTGGAT 


CGAGTATCTG 


AAAAGTTAAA 


4140 


TGaTGGATTA 


CATCCAGGTC 


GTACTGCTGA 


4200 


TATTGGTGAA 


TTACATCCAA 


TATTAGCAGC 


4260 


TGAGTTGAAT 


TTTGATGCAT 


TAATGGCTGT 


4320 


TCCGAGATTC 


CCAGGCATGT 


CTCGTGACAT 


4380 


AGCTGATTTA 


TTATCAACGA 


TTCATGCACA 


4440 
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AAAAGGTAAA AAATCAATTO CAATACGTTT AAATTATTTA GACACAGAAG AAACATTGAC 4560 

AGATGAGCGC GTTTCAAAAG TACAAGCGGA AATTGAAGCA GCATTAATTG AACAAGGTGC 4620 

TGTTATTAGA TAATGATTTA AACCCCATGT ATAAGGATAT CTGAAGTAGA TTGATATCCC 4680 

TAACATGGGG TTTTATTTTT GGGTTCACCA ATTTGGTTCC AATGCATTTA AAAAGTCAAA 4740 

GAGOAACAGC GGAATACAGA TGATGcTTCG CACAACTGCA TAAAAGCCTC TAATGATTAA 4 800 

AAATCAAAGA GGCTTTAAAA TTTTTTGGGC TTTTTCACGA TTTTTAAAAT GCTTTTTTGA 4 860 

AATGGTATCT AAACGTGAAA GACCGTATTT TTTTATAATT TTGGCGGCGA TTACATCGAC 4920 

TTTAGCACCG GCACCTTTAG GAATCGTCAT ATTAATATTT TTTGATATTT GATCCATATA 4 980 

TGTAACAAAT GCGTATCGAG AAATTATGCT TGCCACTGCA ATGGCTAATG ACTTCGATTC 5040 

TCCTTTTGTT TCAAATTTTG TTTTCTTTGG AAGTGGTATA TCTGATAATG OGTAATGGCT 5100 

20 ATACACTTCG CGTTTTGCGA ACTGATCAAT GACGATATAG TCTAATTGAG ACGAATCAAT 5160 

TTTTTCAAGT ACATTTTTGA TGGCTTCATT ATGAAGGGCA GCTTTCATTT TTACTTGAGT 5220 

CCAGCCTTTT GCTTGCTGAA TATTATATTT TTCATTGTGT AGTGTTAATA ATGAATGTGG 5280 

TATGAAAGTA ACCAATTGCT CAGCAAGTTC TACAATTTTG GTATCGGTTA ATTTTTTTGA 534 0 

ATCATCTACA CCCAAAGTTT TTAAAATAGG GACATGCTCT TTGGTAACGA AAGCAGCACA 54 00 

CACAGTCAAC GGACCAAAGT AATCGCCACT TCCAGCCTCA TCACTACCAA TACAGTTAAA 5460 

TTGrTCATAC ATTAaAGTTg TcCAgAAAAG AATTAGCCAT ATTTnCCTTT 5510 
(2) INFORMATION FOR SEQ ID NO: 166 : 

" :. U) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9623 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
Z (D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 166: 

GnTTATACTT ATAAATTTTA CGGGGGTAAT ATAATACTtA TTTACCTGTA ATATATGATA 60 

ATTCTTCAGC GGCAGCTGCG TTGATAGTTC TATGAGAAAT GATACCTAAT CCTTTAACAT 120 

TGGATTCTGA AATAACGATA GAACCATCAC TGTTAACTTT TTCAACAAAT GCTACATGAC 180 

CGTAATGTTG ATCTGCACCA AATTGTCCAG CCTCAAATAC AACAGCAGCA TGACGTTTTG 240 

GTGTATGACT TACTTGATAA TCACGGTATT GAGCTCGATT ATTCCAATTA TGTGCATCAC 300 

CTAAATCACC TGAGATAGAT GTACCAAATT GTTTCATACG GTTATATACG TACCAAGTAC 360 
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ATGAATCATC ATAATCCTTG ATAGAACGTT CATATTTATC TAAATCTGGC ATGCGTTCAT 480 

CGTCAAACTG AGTTAATTGA TAGTGTTTAA TAATACTGTT TAATTTCTTA GCATAGTTTG 540 

GATCTGTAGC ATATQTTTTA GATAAGTGTG ATCTTGCATC TTTATAAGAA TCGGCTTCCG 600 

ATTTCCATGT TGGTTTATAA ATTGTTCGAT TGCCATCAAT ACCATTTTTA ATAAGGTCAG 660 

AGTAATCTTT TAGTGATTCT TTCGTGCTTG GATATTTTCG GAATCCAGCA TTAATACTAT 720 

ACAATTGATT ACCATCAGCT TCTAATGTGT TAAAAGGAAC AGAATTCCCT TCaAAAGCAC 780 

CTTTGATACC GAATAAATTA TGGTTTGGTG ACwTAGCTAA AGCACTACGA CCTGAGTCAG 840 

ATTCTAAGAT TGCTTGGGCA ATCATGACAG AOGCATAAAT ATCGTTATCT TGACCAATGC 900 

GATGTGCATC TTTAGCAATT GATTTGACAA ATTGACGTGT ATCTTTTGAG TCAACAACGT 960 

TAAATTGTCC GCTATCATCA TTGTTAGATA TACTAGGATC TGTTTCGAAT AATGATGTTG 1020 

20 CACGTGTATC CTTTTGATTA ACATCGTTAT TGAATGATTG AGCAGGTTTA GATTTATGTT 10 BO 

TCAATTCATC TTGTGTTGGT AACTGTGGAT TCTTTGTATT AGATTTTTCA TTTTTGTCTT 1140 

TTTTAGATTG AGATGCATAA TCTTTTTGTG TTTTCTTTGC ATCTTCACTG TATTGATCCA 1200 

AAATAGAGTC TAAAGCCGAA TCTGACATTG ATTGATTATC TTTCGATGAA GATTTTTGAT 1260 

TTGCTTTATC GTCACTTGCT GGTTGACTAT TTGATTGATT AGGTTGTGTT GGCTTTGGOG 1320 

AATTTGGTTG CTTATTAGAT GTACTTGGTT TTGTATTGTT TGATTTAGGT GCTTTTTGAT 13 80 

TGTCTGCTTT ATCTTGTTTA GATGATTGCG TATCAGTGTC ATTTTTGATG CTATTGTCAC 1440 

TGTTTTTATT CGAATCATTT GTTGACTTTT CGCCATTACG AGGTTGTTCG TAATCAGAAA 1500 

TATCCGAATT TAAATTGAAT AAGTTTTGGA TTAAAGTTGT TAATGAGTAA TTATCATCGT 1560 

ATTTATTTTT GGTTAGCAAT TGGTTTATAT TGGTTTGTGG TAAATTCTTA TAAATAAAAT 1620 

CAAlQATATT GTTAGAGTCT GAAGTGCTGT CGTCTATAGT TTTAAATTTT TTGTCGTTAT 1680 

40 TGTCTTGGTT ACTTGTATTA TTTTTGTCTG CTTTATCAAT ATCTTTACTT GTAGTATCCT 1740 

TAGAAGTTTC ATCGTCATTA GATTTTTTTG AATCATGAGA TGTTGTCTTA GCTGTAGTAT 1800 

CTTTTTGAGG TGTATCAGCA TAAGCGgTAG GTGAAaCTAA AGTAGGTAAT ACGAGCGTAG I860 

TTGATAGCAA ATAAATTAAA ATTTTATTTT TAGGCATATT TOGTATTCTC CCTTGAAAAA 1920 

TATAATAATT AAGTGTGATA ATAAACTATG ATTTGTTATA ATTTATCGTA TGCTGAAAAT 1980 

AGTTGATAGG TATCAATCGA CTAAATATCT TCCAGTAAAT TGATTATACT AATTCACAAC 2040 

GCAAAAATAA ATTAATTTAC AAAAAATATA TAAAAAATAT GAATAATTCC TACATAGGAG 2100 

TGTGACAATG AAGAACGCAT TTAAATTATT TAAAATGGAT CTGAAGAAAG TAGCTAAGAC 2160 
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15 



20 



30 



35 



40 



45 



60 



TAACTTATGG 


GCAATGTGGG 


ATTT'ATATW^ 




raoiTrfi Ann 


«T> fYl/"" 1 A riTTVlT 
X XjyJJvJt 1 Ui 1 


2280 


TAATGAAGAT 


AAAGGCGACA 


PA ATf*Af5 AG/2 


wwvvviu 1 1 


AATYnWWPA 


AX ALuA i vj^J 1 


2340 


TAATACACTC 


AAGAAAAATA 


A & & ft'PT'TTVS A 


1 1 vjVjt-AVJ 111 


fWh. AflT A f2 A fl 
U 1 AWJ 1 J\\Jr\\J 


A fl A A in f"*fYX & 
Mk»AAAvjv_ x\iA 


2400 


TCATGAGATA AAAATGGGTA 


AnlAl X X XV9\_ 


nUUlnl 1 1AW 


nlvUvnl W In 


Aur 1 1 1 ACACA 


2460 


TGAAATTACA 


GGGACACTAC 






Lr A IVj 1 AulAA X 


iJvpR A/*«^''m'»A A 

1TAAGGTGAA 


2520 


TCAGAAGATT 


AACGCTGTTG 




AACAGATaCT 


GGI iCGTCAG 


TTGTCGTTGA 


2580 


AAAAGCGAAT 


d A A C* A ATTT A 


ATAAAACAGT 


AACTCGAGCA 


TTATTAGAAG 


AAGCTAACAA 


2640 


AGCAGGTTTA 


A tTATTfi A AO 


AAAATGTGCC 


GACAATTAAC 


AAGATAAAAA 


ATGCGGTATA 


2700 


X X U/iu\^vjA1 


AAAGCTTTAC 


CTAAGATTAA 


TGACTTTGCG 


AATAAAATTG 


TATATTTGAA 


2760 




uIAjuAX 1 lAu 


ATAAATATGC 


CAATGATTTT 


AGAAAACTAG 


GAAATTATAA 


2020 


Auu XVjAlAl i 


i'1'AGATG CTC 


AGAAAAAATT 


AAACGAaGTC 


AATGGTGCTA 


TTCCGCAACT 


2880 


1 Aft. X vyAAAAG 


GCTaaGTTGA 


TATTAGCTTT 


AAATAATTAT 


ATGCCGAAAA 


TTGAAAAAGC 


2940 


GTTAAATTTT 


GCAG CTGATG 


ACGTGCCAGC 


GCAGTTCCCT 


AAAATTAATC 


AAGGACTTAA 


3000 


CATTGCGAGT 


CAAGGTATTG 


ATCAAGCTAA 


TGGACAGTTA 


AATGATGCCA 


AAGGCTTCGT 


3060 


CACAGAAGTT 


AGAAGTAGAG 


TCGGTGATTA 


TCAAGATGCA 


ATTCGACGCG 


CGCAAGATTT 


3120 


AAATCGAAGA 


AACCAGCAAC 


AGATTCCTCA 


AAATAGCGCG 


GCGAACAACG 


AAACATCAAA 


3180 


TAGTGCACCT 


GCAGCTGGTA 


ATGGTGTAGC 


ATCAACGCCA 


CCAAGTGCAC 


CAAGTGGCGA 


3240 


TACTGCACCA 


AATAATAATG 


TTACGCAAAA 


TACCGCACCA 


AATAGTAATA 


ATGCGCCTGT 


3300 


ATCGACTACA 


CCACAAAGTA 


CAAGCGGGAA 


AAAAGATGGT 


CAAAGTTTTG 


TAGATATAAC 


3360 


AACAACACAA 


GTCAGCACAG 


CTAACGAGAA 


CACACAAAAC 


ATTACAGATA 


AAGATGTTAA 


3420 


atcajCtggaa GCGGCATTAA 


CGGGCTCTTT 


ATTATCATTA 


#T1 H Ik It fTl ^k mm 

TCAAATAATT 


TAGATACCCA 


3480 


AGCGAAAGCC 


GCACAAAAAG 


A T*T\i^"T'/** A /~*f*t~* 

AlAu 1 CAGC»L. 


ATTACGTaaT 


ATTT CGTATG 


GGATTTTAGC 


3540 


ATCGGACAAG 


CCTTCTGATT 


TTAGAGAGTC 


TTTAGATAAT 


GTTAAGTCCG 


GTTTAGAATA 


3600 


CACAACGCAA 


TATAATCAAC 


AAx 1 1A1L\jA 


i AL-A II AAAA 


GAGAI xGAGA 


A A A »TV11> » *l » 

AGaATGAaAA 


3660 


TGTTGATTTA 


TCAAAAGAAA 


TTGATAAGGT 


AAAAGCAGCT 


AATAATCGAA 


TTAATGAATC 


3720 


ATTAAGGTTA 


GTTAATCAAT 


TAAGCAATGC 


ATTAAAGAAT 


GGTAGTTCAG 


GAACTGCTGA 


3780 


AG CT ACT AAA 


TTACTAGATC 


AACTTTCAAA 


ACTAGATTCA 


TCATTATCAT 


CATTTAGAGA 


3840 


TTATGTTAAA 


AAAGATCTTA 


ACAGCTCTTT 


AGTATCAATA 


TCACAACGTA 


TTATGGATGA 


3900 


ATTGAACAAA 


GGGCAAACTG 


CATTATCCAA 


TGTTCAGTCT 


AAATTAAATA 


CAATTGATCA 


3960 
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AACAGTATTA CCAAGTATTG AACAACAATA 
CTTCTCGAAA GTGAAAAGTG ATGTAGcTAA 

5 

ACAGTTAGAA CAGCGATTAA CTAATGCGAC 
ATTAAATGGT TATGATCAAG OGGTAGGATT 
GGCTTTATCA GATTTAGCTG ATTTTTCTCA 

10 

GAAAAAAGCG AATAAAATTT TCAAGAAATT 
CGACACACTT AAGAATGATT TGAAAAAGCA 

IS GAAGACTGTT GATGTTTTCC CAGTTAAGGA 

TGCACTGTCA GTATGGGTAG GTGCACTCTT 
ACATAAGAGT CTAGAGTCAG TCTTAACGAC 

20 CTTTATAATG CTTGGTATGT TGCAAGCACT 

AAAAGCAGGA GTTGAGTCAC CTGTATTATT 
TTTCAACTCA ATCGTATATA CGTGCGTATC 

25 

AATCGTATTG CTTGTATTAC AAATTGCAGG 
GCCACAATTT TTCCAAAACA TTTCGCCATA 
ACGTGAAACA GTAGGCGGTA TTGTTCCGGA 

30 

GTTATTTGGT ATAGGATTCT TCGTTGTAGG 
GATGAAGCGC GTATCTGAAA AAGTTGACCA 

35 ACACATTAGG GTTATAGCTC CTTAATGTGT 

GTAATTTCTG TCTTTTATGG GACGGTTGTT 
TAG GACTAAT ATTACCGACA AAGTGAATAT 

40 AACCTTTTTG GATGTCATAG TGCTTATCGT 

TTGTAACTAA GCAATAAGCA TGTGGTTTAT 
TATATACTGC AAAATATTGA TTATCTACAA 

45 

TTGTTATAGG AGTAGTATTT GGTTCATGAT 
CTAAGTGCAA ATCACGCAAT TGACCATTTT 
ATGTCGTATC GGAGGATTGT TGTGTCTCTA 

50 

CAGTGCCAGC AGGAACATAA TAAAAGTCAC 
TGTCAAATTC ATGATTATCA ATCATGTCTA 

55 



CATTAGTGCT 


GTTAAAAATG 


CTCAAGCAAA 


4080 


AGCTGCTAAC 


TTTGTGCGCA 


ATGACTTACC 


4140 


AGCAAGTGTG 


AATAAAAATT 


TACCAACGTT 


4200 


ACTAAATAAA 


AATCAGCCAC 


AAGCGAAAAA 


4260 


AAATAAATTG 


CCTGATGTTG 


AAAAAGATTT 


4320 


AGACAAAGAT 


GATGCAGTCG 


ACAAATTAAT 


no 


AGCGGGTATT 


ATTGCAAATC 


CTATTAATAA 




*i * r ATYyrrrf* a 


GGTATGACAC 


CATTCTATAC 




GATGGTAAGT 


TTATTAACGG 


TTGATAATAA 




AAOAjCAAGTG 


TTCTTAGGTA AGGCAGGATT 


AC*5f\ 




GTTGGAGATT 


TGTTAATCCT 


a c o a 


TYST A fT*P AT* A 


ACGATTTTCT 


GTTCGATTAT 


A. "7 A A 

4740 


ATTACTTGGT 


AACCCAGGTA AAGCCATTGC 


4800 


TGGTGGGGGA 


ACATTCCCAA 


TTCAAACTAC 


4860 


CTTACCATTT 


ACGTATGCAA 


TTGATTCATT 


4920 


AATCCTAATT 


ACAAAATTAA 


TTATATTAAC 


4980 


TTTAATTTTA AAACCTGTAA 


CAGATCCATT 


504 0 


AAGTAACGTT 


ACAGAATAAA 


AATTAAATCC 


5100 


GGATTTTTAT 


GTTTTTAGAC 


AGAAGAGATA 


C 1 C A 


ATCATTGCTA 


TTATCCAGGA 


TGACTTACTA 




CCTCGTCTTC 


CGTAGTTAAA 


ATAAAGCTAG 


coon 


TTACTGTTAA 


AGTACCAGTA 


CCATCGATAA 


5340 


TGAATTTTAA 


ATCTCCATGA 


ATATCCCATT 


5400 


ATTGAGTTAC 


AGTGTGTGTG 


TOGATGTGAG 


5460 


TGCCTAATTC 


AATCACATCT 


TTACTTTGCT 


5520 


GATCTCGTCT 


ATCATAGTCA 


TAAATACGGT 


5580 


AAATTAAAAT 


ACCOGAACCA 


ATGGCATGGA 


5640 


CGGGCTTAAC 


AGGTATACGT 


TTGAAAAGAC 


5700 


TTAACGTCTG 


TTTATTATGT 


GCATGTACGC 


5760 
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GTTCGCCTTC 


GTGTTTTAAA 


GCGTAGTCAT 


CATCTGGGTG 


AACTTGAACA 


GATAATTTAT 


seeo 




CATTOGCATC 


TAATACTTTA 


GTTAGCAGAG 


GGAAACTATC 


TCGTGAATCA 


TTATCGAATA 


5940 


c 
o 


ATTGACGATG 


TTGTGACCAA 


AGTTGATCTA 


GGGTCATATC 


CTTGTATGGA 


CCATTGATAA 


6000 




TTGTATTAGG 


ACCATTTGGA 


TGTGCAGAAA 


TTGCCCAGCA 


TTCACCAGTT 


GTTTCATTAG 


6060 


10 


GGATATCATA 


GTTAAATGCT 


TTTAATGCAT 


GACCGCCCCA 


AATTCTGTCT 


TTAAAAACGG 


6120 


GTTGTAAAAA 


TAATGCCATA 


GTTAAAACTC 


CTCTATATTT 


TCATTAATAA 


GTTATAAATT 


6180 




TCTGTAGTAC 


TGTTTGCATT 


AATTAGTGAT 


TGGCGTGTCT 


CATCATTCAT 


TAACGCTTTA 


6240 


16 


GATAAGCOCT 


GAAGTATTTT 


TAAATGTGTA 


TCCTGACTGT 


TGTTTGGTAC 


GGCAATTAAG 


6300 




AATATCAATT 


GAGGTAGACT 


ACCATCTAGA 


CTGTCCCATT 


TAACACCATG 


ATTATTTTTC 


6360 




ATAACAGCTA 


CAATCGGTTG 


TTTTACAACA 


TCAGACTTTG 


CATGTGGAAT 


GGCCACGTTC 


6420 


20 


ATGCCAATAG 


CTGTCGTAGm 


t CcATTTCAC 


GTTCTAGTAT 


TGCATTTTTT 


AAATGCGATG 


6480 




TGTGCTCTAC 


ATAACGGCAA 


ATTTTAAGTT 


TATGAATCAA 


CATATCAATT 


GCTTCGTTTC 


6540 




GAGACATGTC 


GTGATCAGTA 


ATTATCATAG 


TTTGTTGATC 


AAAAACATGA 


GAAGGTTTAT 


6600 


25 


TGAGATGTGA 


ATGTTTCGCG 


GTGTTATCTA 


CATTGTCAAC 


CTCTGTATCA 


TGTTGTGTAA 


6660 




TATCTGTATC 


ATGAAGTTGC 


GTGTGTTGCG 


CTGGTGCATC 


TACTGCTATA 


ACTGGTGTAT 


6720 


30 


TGOGTTTTAA 


TAATAGTACA 


GTAGTCATTG 


TGACAAGACT 


ACCTACTATC 


ACTGCAAAGA 


6780 


TAAACCATAA 


TACATGATCA 


ATACCACCTA 


ATACAGCCAC 


GATTGGACCT 


CCATGTGCGA 


6840 




CTCTATCGCC 


GACACCACCA 


ATGGCTGCAA 


TGACTGATGC 


AATCATTGCA 


CCAATGATGT 


6900 


35 


TTGCAGGTAT 


AATGCGCAAT 


GGATCTTGGG 


CTGCGAAAGG 


AATAGCACCT 


TCAGTAATAC 


6960 




CAAATAGTCC 


CATAGTGAAG 


GAAGCCTTAC 


CCATTTCTCT- 


TTCGGAATGA 


TTGAATTTAT 


7020 




ACTTTTGAAC 


AAACGTTGCT 


AAACCTAAAC 


CGATTGGTGG 


TGTACATACA 


GCAACTGCGA 


7080 


40 


CCATACCCAT 


AACGGOGTAA 


TTACCTTCAG 


CAATAAGTGC 


TGAGCCAAAT 


AAAAATGCTA 


7140 




CCTTGTTTAC 


TGGACCGCCC 


ATATCGAAGG 


CAATCATCGC 


ACCTATAATC 


ATCGCAAGTA 


7200 




TAATAATATT 


AGCACCTTGC 


ATACm-lTA 


ACCAGGTTGT 


TAATGCCTCA 


AAAATATTAG 


7260 


45 


AAATTGGTGC 


ACCGATTAAA 


AATATAAATA 


TCAATCCTAC 


AACGACCGAT 


GAAATAATGG 


7320 




GAATAATAAT 


GATAGGCATA 


ATTGGTGCCA 


TTGCTTTTGG 


AACTTTAATA 


TCTTTAATCC 


7380 


50 


ACTTTGCGAT 


ATAACCTGCT 


AAGAAACCAG 


CAACAATACC 


ACCTAAAAAT 


CCTGCGCCTG 


7440 


CATCACTGCC 


ATAAAAACTA 


CCGTCAGCAG 


CGATAGCGCC 


GCCAATCATA 


CCAGGAACAA 


7500 




GACCGGGcTT 


GTCAGCGATA 


CTAACAGCGA 


TATATCCAGC 


TAGTATTGGA 


ACCATAAATT 


7560 
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ATCCTTTTGA TOTCOTTtCA CCGCCTAGAG TCAGCGOGAT GGCGATAAGO AGTCCACCAA 7680 

CTACGATAAA AGGAACCATA AACOATACAC CGTTCATTAA ATGTTGATAC ACCATTTGAA 7740 

5 

TACCATTTTT AGACTTACCG CGATCTTTCG AATGATAATT TGTTTCAGAT TGATAAATAG 7800 

GCGCATCTTG ATTAATGATA CGTTGAATTA GACCTCTCGG ATTATGAATC CCTTCGCGAA 7860 

CATTTTCATT AATCAACCGT TTACCAACAA ATCGGGACAG ATCAACTTGT TTATCAG CTG 7920 

10 

CAATTATGAC ACCGTCAGCT TCTTCGATGT CTTGCGTAGT TAAAACATTT TCAGCACCAA 7980 

CACCGCCCTG TGTCTCTACT TTAATATCCA CACCCATTTC TTTTGCTACC TGCTCAAGCT 8040 

75 TTTCTTGAGC CATATATGTA TGTGCAATGC CATTTGGGCA TOAGGTAATA GCTACAATTT 8100 

TCATAAAATC ATCTCCTTTT CTATATTGTA AGCGTATTCT OGATACTAAA AAAAAGAATA 8160 

ATTACCGTTA CTAGTGGCAA TTATTCTTGT AAGTATTCAA ATAACTGTTG CTTTAAACTA 8220 

20 TGATCATCTA AACTACATAA ATGGTTCACT GAATCATCAT CCAAGTTAGC AATTAATTGC 8280 

ATCATTTGTT TTGTAAAAGC TTTGTCTTTA TGCGAAATCG CTAAGAAAAA GACAAGTTTG 8340 

ACATCGTGTT GTCGCCAAGG AAAAACATCT TTTGTGCGAA AAATAAGCAC ATGTGATTGT 8400 

25 

AAAACTTTTT CAGGATCTCC ATGAGGAATC GCCATAAAAT T AC CT ATGT A TGTAGAAGAT 8460 

GATTTCTCAC GCTCTAAAGC TGATTCGATA TATCCTTCTA CAATCGCATG ATGTGCTTGT 8520 

AATATTTTTT GAGCTTCTTC AAAAATTTGC ACAGTATGCC GTGATTTTTG TTCAGTATTT B580 

30 

ACGACAAGGA AATTGACAGT GTCCATATGA TGATGTGCTT GAACCGGATT TTGCTTTTGC 8640 

TTCACAACGT GTCTGATTTT GTGACGATCA TCTTCAGAAA ATAATGGTGC AACCTTGATA 8700 

GTCGTCAGGT GCTTAGGAAG TATGTTTAGC GTTTGTTTAG GAATATCATG GGTCGTTATT 8760 

3S 

AATAAATCTA CATTGTCAAA GTGATAGTGT GTTATATTTT CTAGTTTAAT OGTATTTATC 8820 

ACTGACAACT CTTCGGATAA GTTATTTATT TTAGTTTCTA AAAAATTCGA CACACCTAGA 8880 

40 CCATAATAAC AAGCAATGAC TACATTTAAT TGTGTTTTGG TACGACGCTC GATGGCAGCT 8940 

TGAAAATGAA TTGTTAAAAA TGCAATTTCA TCTTCGCTCA TCTCTATATC AGTATCAATT 9000 

GCTAATTTAT CAATCGCTTC AAAAAGTGTG TTAAACACAA AGGGATAGAG TTTTTTAATC 9060 

45 TCTATAACTA AAGGATTGTT TAAATAAATG TTTTGAGTGA TACGTAAATA TGCTTTACTA 9120 

AAATGATTAT ATAAATTTTG TTGTAAAATC GAATCTTCAT TGAAAGGTAC ATGAATACGT 9180 

TGCTGCATCA ATTCGATTAA GCGATCAATA TAACTTTGTA TAAATATAOG TTCTATGCCA 9240 

60 

ATATCGAGTT TATTAAAATG ATAAGCAATA AAGAATGAAA ACATATTGAT TACTTTTTCG 9300 

TTCAAGTCAT AACCTAATCT TTCGTTGATT TGCTTAATGC AAGATTGAGA TATCAATTTT 9360 
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AGATGAATTA AAAGCTGTTG TATTTOAATA TCAGTTGTTT CAATACTATG TTGTTGAAGT 9480 

GTCTCTTGTA TAATATGCGA AATCATCCTT TGGTGTGAAT CAGGTAATTC aTTTAAAATT 9540 
5 

AGGTCTTCAA CATGTACATG CCCTGATGAT AATTGATTTA AATGGATGAT GGCATTAGTG 9600 
ATATCATTAT CTGTTCCATC GAC 9623 
(2) INFORMATION FOR SEQ ID NO: 167: 

10 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1021 base pairs 
<B) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
1S (D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 167: 



20 



25 



35 



45 



ACCGTGGAAA 


CACGTCTAGT 


CAATCAGAAA 


GCGATAAAAA 


TGTGACTAAA 


TCATCTCAAG 


60 


AGGAAAATCA 


AGCAAAAGAA 


GAATTACAAA 


GCGTTTTAAA 


CAAAATTAAC 


AAACAATCAA 


120 


GTAAGAATAA 


TTAAAAAATT 


TTGATATTGT 


CTATGTTTAT 


AGTTCACAAG 


CCATTCAACG 


180 


TATTGTAAAC 


TAAGGATAGT 


GTATTTTTTT 


AATAGTAATT 


TGTCAGGAGG 


TGCCTATCTA 


240 


TGGAAGAACA 


TTACTACGTA 


AGTATTGATA 


TTGGATCATC 


AAGCGTAAAA 


ACAATAGTAG 


300 


GCGAGAAATT 


TCACAATGGT 


ATAAATGTGA 


TAGGTACAGG 


ACAAACCTAC 


ACGAGCGGTA 


360 


TAAAAAATGG 


TTTAATTGAT 


GATTTTGATA 


TTGCG CGACA 


AGCAATCAAA 


GACACAATTA 


420 


AAAAGGCATC 


AATCGCTTCG 


GGTGTTGATA 


TTAAAGAAGT 


TTTCCTGAAA 


TTAC CTATCA 


480 


TTGGAACGGA 


AGTTTATGAT 


GAATCAAATG 


AAATCGACTT 


TTATGAGGAT 


ACAGAAATCA 


54 0 


ACGGTTCACA 


TATCGAAAAA 


GTATTAGAAG 


GTATTAGAGA 


AAAAAATGAT 


GTGCAAGAAA 


600 


CAG^AGTAAT 


TAATGTGTTC 


CCGATTCGTT 


TTATAGTCGA 


TAAAGAAAAT 


GAGGTTTCAG 


660 


ACCCTAAAGA 


ATTAATTGCC 


AGACATTCAT 


TAAAGGTTGA 


AGCAGGCGTA 


ATTG CTATTC 


720 


AAAAATCGAT 


TTTAATTAAT 


ATGATTAAAT 


GCGTAGAAGC 


ATGTGGTGTT 


GATGTATTAG 


780 


ATGTTTACTC 


TGATGCATAT 


AACTATGGTT 


CAATCCTAAC 


AGCTACTGAA 


AAAGAGTTAG 


84 0 


GTGCATGTGT 


CATTGATATT 


GGTGAAGACG 


TTACGCAAGT 


TGCTTTTTAT 


GAACGCGGTG 


900 


AATTAGTAGA 


TGCTGATTCT 


ATCGAAATGG 


CAGGGCGTGA 


TATTACaGAC 


GATaTTGCAC 


960 


aAGGrTTaAA 


CACTTCTnAT 


GAAACTGCTG 


nAAAAAGTTA 


AACACCAATn 


TGGTCATGCA 


1020 



50 

T 1021 
(2) INFORMATION FOR SEQ ID NO: 168: 
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(A) LENGTH: 7963 base pairs 

(B) TYPE : nucleic acid 

(C) STRAND EDNESS : double 
<D) TOPOLOGY: linear 

5 



(Xi) SEQUENCE DESCRIPTION; SEQ ID NO: 168: 



10 


TAATCTATTA 


TAAAAACTGT 


CCATACCCTT 


TGATTACCTT 


CTCTTCAGGT 


ACAGGCCACA 


60 




CTTGAGGCCA. TAAGCCATAT 


GCTTGCTGTG 


AATAAAATTG 


TGCCATTTGT 


AACAATATAA 


120 




TATATACAAA 


TAAACACCCA 


ATAATTGCTG 


TCACTAATGG 


ATATGATAAC 


CAAACCATTA 


180 


1S 


ATAAAACTGC 


AATAATTACT 


AACCTAAAGA 


TAATATTAAA 


TGCGTCTCTC 


CCTCTTATAA 


240 




AGCTTCTAAT 


AAATAAGAAT 


AAATACATCG 


CATTAGAGTT 


AAATTTACTA 


CCCTTTGGAA 


300 




CTGGTAAAAG 


TATATCTAGA 


TAACTTCTTC 


TGACTGCAGA 


TTCTTTCAAA 


TGTTTTACAT 


360 


20 


CGGTGAACAT ATTAACAAAT 


TTATAATAAT 


TCATATGATG 


TCGATGTTCG 


ATTGCAATCA 


420 




TTTTCTCCCA 


AGGATACAAA 


AAGCCTGGTT 


TATATTTTTT 


AACTAAAAAT 


TCTATTAACA 


480 


25 


CAGGCAAAGC 


AACCATCACA 


AATGCGATGT 


ACCATTTTGG 


AGCTAATAGT 


AAGTAATATG 


540 


TTAGAGCAAA 


GGTGATGAAT 


GATATTAAAT 


TAACTTGCCA 


TGTTTTAAGT 


CCCGATTGAT 


600 




ACCATTGCCA 


TCTTAAGCGT 


AAACCAACAT 


ATGGAAAAAT 


TAATGCACTG 


ACTCCAAAAC 


660 


30 


AAATATAAAA 


TGCCACATTA 


TGTTGATTAA 


TATTGTAAAA 


CAACGGGAAC 


ATTACAATAA 


720 




CAATAATGAG 


TTGGATTAAT 


ATGCGCGCAA 


AGTAACTATA 


TAAAATCGCA 


TGACGCATAA 


780 




ATTGAGACAT 


GTGTTTTTCA 


AATGGTAATA 


AAAAGATTTT ATCCgCTTCT 


TTTAACAGTG 


840 


35 


GTCsCmTTGG 


AAAAATAGrT 


GTCAACGCAA 


CAATCACTGC 


TGCTATTaAT 


GAAAAATTGa 


900 




TATTCGTTGG 


AATATGTTTT 


AACCATTCAC 


CATATCCArA 


AATAAATGCA 


CCCAGCAAAA 


960 




TAAGTAAAAA 


GACCATGAAA 


TGACCATTAA 


ATATAAACTT 


ATTATAATAA 


TTTTtCTCTT 


1020 


40 


TACGAAGGGC 


ATGTAATCTT 


TTATTAAATA 


ATGTGGTAGC 


TTGGTTACGC 


ATGTACATCT 


1080 




CCACCTTGCG 


TCACATGAAT 


ATATATATCG 


TCTAATGTTT 


GATTATGTAA 


GCCAGTTTGT 


1140 


45 


TGTCTCAATG 


CTTCTAAATC 


TCCAAATGCA 


ACGACTTCAC 


CTTCGTCTAG 


TATGaTAAAA 


1200 


CGATCACAGT 


AACGTTCAGC 


TGTTGCTAAA 


ATATGTGTAC 


TCATTAGAAC 


GGTTCTACCT 


1260 




TCGTTTTTCT 


TTTCAACCAT 


TAAATCTAAC 


ATGGATTGAA 


TTCCTAATGG 


ATCTAGGCCA 


1320 


SO 


AGGAATGGTT 


CGTCTATAAT 


ATACAATTCG 


GGATTAACGA 


TAAACGCACA 


AATAATCATG 


1380 




ACTTTTTGTT 


TCATCCCCTT 


AGAAAAATGA 


CTCGGAAAAA 


CTTTCAACTC 


ATTTTCTAAA 


1440 




CGGAATGTCT 


TTAATAATGG 


CATTGCTCGA 


TTCATCGTTT 


CATCACGATC 


AATATCATAT 


1500 
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TCCGGAATAT 


AAGATAACTT 


TCTTCTATAA 


GCCTCTATGT 


CATCATTAAT 


GTTGATATCT 


1620 




GAAATTGATA 


GAGATCCTTC 


CATAGGTGTA 


AGCAATCCTA 


GCATATGTTT 


AATCGTTGTA 


1680 


5 


CTCTTACCAG 


CGCCATTAAG 


GCCAATAAGT 


CCAACAATTT 


CGCCTTTGTT 


TAATTCAAAA 


1740 




TTTATATCTT 


TAATTACAGG 


GCGTTTTCCA 


TATCCACCTG 


TAAGCTGTTC 


TACTTTAACT 


1800 


10 


GTCATAAGGC 


ACCTCCATGA 


CTTATATTGT 


ACCAAAAATT 


ATAAAATGCT 


CATATTAAAT 


1860 


ACACATGTCC 


TAATATCGAA 


TTTTTAGCGA 


CAATGTTATA 


ATGAATGGTA ATACTAGTTG 


1920 




AAAAGGAGTG 


TAGTCATCAT 


GTCAGAAACA 


ATTTTCGGCA 


AAATTTTAAC 


TGGAGAAATT 


1980 


15 


CCTAGCTTTA 


AAGTATATGA 


AGACGATTAT 


GTCTATGCCT 


TTTTAGATAT 


ATCACAAGTT 


2040 




ACTAAAGGAC 


ATACGTTATT 


AATTCCTAAA 


AAAGCTTCTG 


CTAATATCTT 


TGAAACTGAT 


2100 




GAAGAAACAA 


TGAAACATAT 


CGGTGCAGCA 


TTACCTAAAG 


TAGCAAATGC 


TATTAAGCGT 


2160 


20 


GCATTTAATC 


CTGATGGTTT 


AAACATTATT 


CAAAATAATG 


GTGAGTTTGC 


AGATCAATCT 


2220 




GTATTTCATA 


TTCATTTCCA 


CTTAATT C CT 


CGATACGAAA 


ATGATATTGA 


TGGATTTGGT 


2280 




TATAAGTGGG 


AAACACATGA 


AGACATTTTA 


GATAACGATG 


CAAAACAACA 


AATTGCTGAA 


2340 


25 


CAAAXTCAAG 


CACAATTTTA 


AATGTATGCT 


TAATCTAAGC 


TCGAACGGGT 


ATAATATGAT 


2400 




TAATATTATA 


ACAATTG CGT 


TTGAAG TG AT 


AACATCAAGG 


TTAGCAATTT 


TAAACAAAAT 


2460 




GAGTT AT CAA 


GATAACAGAT 


GTTAAAAGTG 


AGGAGAATAT 


AAATGAAAGC 


ATCACGCATT 


2520 


30 


C TATTCGGT A 


TCGGTGTTGG 


CGTAGCAGCT 


GGTTTTGTAG 


TTGCACTTCA 


AGGACGTGAC 


2580 




GACAAAAGTG 


TCAAGAACAA 


CACGATCGAT 


CGTACTGCCC 


CTACTGGTTC 


AAAATCAGAA 


2640 


35 


CTACAACGTG 


AATTTGAAAC 


GATTAAACAA 


AGTTTTAATG 


ACATTTTAAA 


CTATGGTGTT 


2700 


CAAATTAAAA 


ACGAAAGTGC 


GGAATTTGGT 


AGTTCAATTG 


GTGGTGAAAT 


TAAGTCATTA 


2760 




CTTGGAAACT 


TCAAATCTGA 


CATTAATCCT 


AATATTGAAC 


GTTTACAGTC 


ACACATCGAA 


2820 


40 


AATTTACAAA 


ATCX3TGGCGA 


GGATATTGGA 


AACGAAATTT 


CTAAGTAGCA 


GGTTACGTTC 


2880 




TCGATCACAA 


CTATTTTTAT 


TAGTAACAGC 


ATATTTATTT 


TTTAAAATTA 


AATGCCAAAT 


2940 




AAACGAGATG 


ACATTAGAAA 


TTAGATATTT 


CTTGTCATCT 


crrrrriTAAA 


ACTCAAATGA 


3000 


45 


ACTTATGTTT 


ACAAATTATA 


GGAAGACATT 


GTTTGTAGTG 


ATTTTCGCTT 


AAATCATATT 


3060 




TATGAATTGA 


TTGAAAACAT 


TGCTTAGGAT 


TCATTGTGTT 


ATCCtTGCAC 


TTTGATTACG 


3120 




CTTTACTTAA 


ATCATTATCG 


ACAAACAACA 


TACTTATATT 


TTCATTGAGC 


CGAACCTTAT 


3180 


60 


ATACACATTA 


CATATACCTT 


ACTTGCACAA 


ATTATTAATC 


TGGTGTTTAT 


TATAATTACA 


3240 




TATCACTATA 


TTTTTAGCAT 


TTGTATAACT 


TAGTTGGTCA 


AAAGATGCTT 


TTGCATATGC 


3300 
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TTTCATAAGT GATGCTTTAT TAGCAAGAAT ATGTGTTCGC AGAAATTTGT TCTGCATTCT ^3420 

ACTT CTACG C TAGTCAATCA GACAATTTTA CCAATCCCCA CTTTCGCGTT TCAAATCAAA 34 80 

5 CAATACGTCG CTCCTTTCTT CTTATATAAC AATTCTTCTA ACATGATATG TTACTATTGA 3540 

ATTACTGAAC CTGAGTTAGT TATAATCTAA CTTATATTGA AAAGAQATGA GGCGTAAGAT 3600 

ATGTTTTTAT QTAAAAGACA AATTGATATC AATGCACGAT TTGGTTTGCC TAGAATTGCA 3660 

10 

TTTATGAGTG CAGTTGCAAC CATCATTATG TTTTTAGTTA GTTATGAAGT AATGTATTTT 3720 

TTATCTAATA CGCCATTATC AGATAGACAT TTTCTCATCT TTTTATTACT TGTATTTATG 3780 

ACGTATCCAT TACATAAAAG TATACATTTA TTATTTTTCT TACCATATAG AAAATCGTTT 3840 

IS 

AAAGTTCATA AGTTAACTAA AAGAAAATGG CTTATATTCT ATAATACCTA CGTCAATCAA 3900 

CCTGTACACA AATTTTATTT TTGCATTAAC TTAATATTGC CGTTAATTAT CTTATCTGCA 3960 

ATGTTCGTTT ATCTAACAAT TTCATTCCCG CAATATGGAC ATTATTTTAT GTT CTTATTG 4 020 

20 

GCATTGAATT TCGGTATTTC CATTACAGAT TTATTATATT TAAAAATAAT TATATTTTCT 4080 

AATTATGGAC AATATATAGA AGAACATAGT ACAGGTATTA ATATTTTGAA AAAAATTAAA 4140 

2S AATCCATATC ATTTATAACA AAATAATTAT AGCAAGGTGT TATTATTTGT TTTTAGGCTA 4200 

TGTAATAgcT tACAATCAAA TGTATATAGA CCTTGTTTTT TTATTTTCAT CAATTTCTAC 4260 

CCCTAAACCT AATGCTCTAG TCTGATGTCA TGGGTTATTG ATTGGTGATA ATATAAAACT 4320 

30 ATGTTATATT CACGATGATT AACTTACAAA GGAGTTTCAA CTATGAAGAT GATAAACAAA 4380 

TTAATCGTTC CGGTAACAGC TAGTGCTTTA TTATTAGGCG CTTGTGGCgC TAGTGCCACA 4440 

GACTCTAAAG AAAATACATT AATTTCTTCT AAAGCTGGAG ACGTAACAGT TGCAGATACA 4500 

55 ATGAAAAAAA TCGGTAAAGA TCAAATTGCA AATGCATCAT TTACTGAAAT GTTAAATAAA 4560 

ATTETAGCTG ATAAATATAA AAATAAAGTT AATGATAAGA AGATTGACGA ACAAATTGAA 4620 

AAAATGCAAA AGCAATACGG CGGTAAAGAT AAATTTGAAA AGGCCCTTCA ACAGCAAGGT 4680 

40 

TTAACAGCCG ATAAATATAA AGAAAATTTA CGTACTGCTG CTTATCATAA AGAATTACTA 4740 

TCAGATAAAA TTAAAATCTC TGATTCTGAA ATTAAAGAAG ACAGCArGAA AGCTTCACAC 4800 

ATTTTAATTA AAGTTAAATC TAAGAAAAGC GACmAAGAAG GCTTAGATGA TAAAGAAGCG 4860 

45 

AAACAAAAAG CTGAAGAAAT TCAAAAAGAA GTTTCAAAAG ATCCAAGTAA ATTTGGTGAA 4920 

ATCGCTAAAA AAGAATCAAT GGATACTGGT TCAGCTAAAA AAGATGGCGA ATTAGGTTAT 4980 

SO GTTCTTAAAG GACAAACTGA TAAAGATTTT GAAAAAGCAC TATTTAAGCT TAAAGATGGT 5040 

GAAGTATCAG AGGTTGTTAA ATCAAGCTTT GGATATCATA TTATTAAAGC TGATAAACCA 5100 
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AAAAATCCAA AATTATTGAC TGATGCATAC 
TTTAAAGATC GTGATATTAA ATCAGTTGTC 
5 AAACAAGGTG GCGCACAAGG CGGACAATCC 

CCGTGGTTCA AAAATCATAC CACGGCCGCT 
GAGCTCATGT TTCAGTATAC TCATCTGTCC 

10 

AGGATTGTAG AATCTACGAT TTTCAAGACC 
AGTTTTTTTA TATGCCTTTT CAAACATATT 
TAAAATTTCT GCTTCTTTTA AGTATGGCAG 

IS 

ATGAGATAAA ATCATATGTC TTAACAACAT 
AGCTGCTTCA ACTACTTCAT CACTCGCAAT 

2Q TGTATACGAC GTCGCAACAG GACCACTCAA 

AATACCACTA TATAACAAAC TTTTGTTTAA 
AATACGTAAC ATCGTTAATA CATGATAGCT 

25 ACTAGCAGCT GGATATGTGT AAAATCGTTC 

ACGTTGTAAA TTAGCATTTT CAATATCTAG 
TGCCGGTGAT AAAGGTGCAC CATCTACAAA 

30 - 

CGCTAGTCTA ATTTGGTTGA CTTTCATCTG 
TTTAACATGT ACAATTTCTT CAGGCTTGAT 

AAATTTCGCT TCAATTTCAC CACTTTTATC 

35 

TTGTGCTGTT ACACCCTGTG TAG CTTTATG 

GGGATTTAGA TT CT CT AT AT TTCTCATCGT 

ATCACTTCTT TTGATGGAAC AATATTATCT 

40 

TGTTCTGATA ATGATCGTAA ATAATTCAAC 
ACAAATGCAT CATCAACAAT TAATGGGAAC 

45 CTGATACGTA AAGCTACATA AAGTAATTCT 

TATAATTGAC CATTAACATG TTTAACCGTA 
TATCTGCCAT CTGTTAAATG CTTCAATATT 

SO CGTTTATCTT TAATTTGTTT AATGTGTTCA 

GCCCAATCTT TTGCGATATC ATTAAGTTGA 

55 



AAAGATCTAT TAAAAGAATA CGATGTTGAC 5220 

GAAGATAAAA TCTTAAACCC TGAAAAACTT 5280 

GGCATGAGCC AATAACACAA AACCGAGCGA 5340 

CGGTTTTTTC GCATTAAAAA TCGGACAGAT 5400 

GATATCTTTT AATTCTTAAT CGAGTGATTC 54 60 

AAATATTTTA TCTGTAAACT GACCCTTGTC 5520 

CATTGTAGCA TCGATATTAT CGATATAGCA 5580 

TTTTGGAGAA CCATACTCTA ACTTACCATG 5640 

GATTTCTTCT CCTTCAATGT TCAATTCACG 5700 

CGAGATGTGT CCTAATAAGT TACCTTCGAC 5760 

TTCTCTAACT TTACCAATAT CATGCAAAAT 5820 

CAATGGATAA ATGTCaCAAA TTGATTTTGC 5880 

TAAGCCACTC GCAAAGTTAT GaTGATGAGA 5940 

TTGATATTTT TTCAATAAAT GACGTGTGAT 6000 

CAAATAATGA GAAATCTCTT CTTGTATTTC 6060 

TTGTTCTGTT TTTAATTGAT CTTCAGTTGT 6120 

TTTATTTCCG CG AT AG TTT A TGATGTCACC 6180 

TGTTG C CAT A TCATTTTTTG TAGCCGTCCA 624 0 

TTGCAAATGT AATGT CATAT AATCTTTACC 63 00 

CACTAAGAAA AAGTGATCAA CTGAATCTCC 6360 

TTCCCGCCTT CCTCTATTTT GTTTAATGTA 6420 

TTTACACATG TAAAGTATAG TACTTGATAG 64 80 

ATTTTTTCAG TACGTTTTTT ATCAAAATGA 6540 

GGATAATATG GTCTTAGTAC CTTAATTAAA 6600 

TTTGTAGATT GACTTAGTTC AACAGGATCA 6660 

ATTGAATCTT CATTATAGTT AATCATCGTA 6720 

TCTACCGCTT CATTAATAAC TTGAGGCAAA 6780 

TCAACTAAAC TTTGTAAATA ACTTAAACTT 6 840 

TTTTTAAGAC TGTGATATTC ATGTCTTAAA 6 900 
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GCTTGCATTT 


CAAGATATTG 


CTCATTATAT 


TCGTCAACTT 


GAGTAGCCAA 


TAAATGATCT 


7020 




TCTTCTTCAA 


GTTGTGCAGT 


TGTTTTTTCA 


CTTAAACTAG 


AACTTAATTC 


ATAAOAATAG 


7080 


5 


TTTTGGTTCT 


CAAGATATTT 


AGTTAAATCA 


TTAAAACGAC 


TCAAATTACT 


AGTATAAGTT 


7140 




TGGTAATCTT 


CATGATGTTG 


GTAAAAATCT 


TCTTCAGTAC 


CAACATTGAT 


AAAATCGAAT 


7200 




AGTGCTGTAA 


TTTCTTTATT 


ATTTTCTTCT 


AATTGAGCAT 


TTAAATGATT 


TAATTCATTT 


7260 


10 


GTAACAAGTT 


TGGTATTTTC 


AGCATTAATA 


CGCCATTTTT 


CATTCGTGTC 


TTCAGCTGAT 


7320 




TTCAACCATT 


GTtGCACATC 


GTGGAATAAA 


GATAATTTGT 


TGAAATAAAC 


AAATTGTGAT 


7380 


15 


TTTGTAACAG 


CTTCAGCATG 


ATTGTAGAAT 


GTATCTAATT 


CTTGAACCAA 


TTGCTGGCGT 


7440 


TGTTGATTTA AATCACTGAT 


ATGTTGATCT 


AATGCTTTAA 


TATTCGCCAT 


TGTAGAAATA 


7500 




CTATCAACAA 


TTAAATCATT 


TGAAATTTTA 


GATGATAAGT 


ATAATTCATC 


CTTAACGTTC 


7560 


20 


TCAACTGTCG 


ATTGTAATTC 


ATCATGACGC 


CCTTTCGCAT 


CATTTAAACG 


ACCTTCAATA 


/ O A W 




TACTGACGTT 


TCTCTTCTAA 


AATTATYTTTA 


•X A a X X WVWtvl 


V» X X w X X 


w X VJfVl V^iV.Un 


•icon 




ATGCGATATT 


GCTCATCAAG 


ATCAAAATCT 


AAGTCATAAT 


TTTCATCTAA 


AATGGCTAGT 


7740 


25 


TGTGCTTTAA 


TTTCTTCGAT 


TTCATCTGTG 


ATGGCCTCGC 


TATAATCTAC 


TTCTTTTGAT 


7800 




TTAGACATGA 


TGATACCGAT 


AACAAATACT 


AAAGTTAATA 


CTGCGAAAAT 


AATACCAAAC 


7860 




AACATGTTGT 


TTGAAATAAA 


TGAGAAGGCA 


GTTAAACCAA 


TACCTACTAA 


TGTTAAAAGr 


7920 


30 


ATAAACGTTG 


TTCGkAACAA 


TTTTTGACGT 


TTTTGttTTT 


CTT 




. 7963 



(2) INFORMATION FOR SEQ ID NO: 169: 

(i) SEQUENCE CHARACTERISTICS: 
3S (A) LENGTH: 3958 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
Z (D) TOPOI/OGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 169: 
ATATTGTCTT TACAATAGTT TGCTATGGAG GTAATTAACC AATAGGAGGA ATTTATAATG 60 
GCAGTAATTT CAATGAAACA ATTACTAGAA GCGGGTGTTC mCttCGGTCA CCAAACACGT 120 

45 

CGTTGGAACC CAAAAATGAA AAAATATATC TTCACTGAGA GAAATGGTAT TTATATCATC 180 
GACTTACAAA AAACAGTGAA AAAAGTAGAC GAGGCATACA ACTTCTTGAA ACAAGTTTCA 240 
SO GAAGaTGGTG GACAAGTCTT ATTCGTAGGA nCTAAAAAAC AAGCACAAGA ATCAGTTAAA 300 

TCTGAAGCAG AACGTGCTGG TCAATTCTAC ATTAACCAAA GATGGTTAGG TGGATTATTA 360 
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GAAGATGGTT 


TATTCGAAGT 


ATTACCTAAA 


. AAAGAAGTAG 


TAGAACTTAA 


AAAAGAATAC 


480 




GACCGTTTAA 


TCAAATTCTT 


AGGCGGAATT 


CGTGATATGA 


AATCAATGCC 


TCAAGCATTA 


540 


5 


TTCGTAGTTG 


ACCCACGTAA 


AGAGCGTAAT 


GCAATTGCTG 


AAGCTCGTAA 


ATTAAATATT 


600 




CCTATCGTAG 


GTATCGTTGA 


CACTAACTGT 


GATCCTGACG 


AAATTGACTA 


CGTTATCCCA 


660 


10 


GCAAAOGACG 


ATGCTATCCG 


TGCGGTTAAA 


TTATTAACTG 


CTAAAATGGC 


AGATGCAATC 


720 


TTAGAAGGTC 


AACAAGGCGT 


TTCTAATGAA 


GAAGTAGCTG 


CAGAACAAAA 


CATCGATTTA 


780 




GATGAAAAAG 


AAAAATCAGA 


AGAAACAGAA 


GCAACTGAAG 


AATAATCAAC 


TGTTGAATCT 


840 


15 


GACTTAGATA 


TAGTTTAAAT 


GGGTGATAAG 


ATATTAATGC 


TTATCACCTT 


TTTTAAAAAG 


900 




AAAATCGAGG 


CAAATTACAA 


ATATTCAATT 


AGAGTATTGG 


CAATCTTGCC 


TATAATAATG 


960 




CTAAAATCAT 


AATATATAAn 


ATGATAACTT 


ATTGGAGGAA 


TAATGAATGG 


CAACTATTTC 


1020 


20 


AGCAAAACTT 


GTTAAAGAAT 


TACGTGAAAA 


AACTGGCGCG 


GGTATGATGG 


ATTGTAAAAA 


1080 




AGOGCTAACT 


GAAACTGATG 


GTGACATCGA 


TAAAGCGATT 


GACTACCTAC 


GTGAAAAAGG 


1140 




TATTGCTAAA 


GCAGCTAAAA 


AAGCAGACCG 


TATTGCGGCT 


GAAGGTTTAG 


TACATGTAGA 


1200 


25 


AACTAAAGGT 


AACGACGCAt 


TATCGTTGAA 


ATCAACTCTG 


AAACAGACTT 


TGTTGCTCGT 


1260 




AACGAAGGTT 


TCCAAGAGTT 


AGTTAAAGAA 


ATCGCTAATC 


AAGTATTAGA 


TACAAAAGCT 


1320 




GAAACTGTTG 


AAGCTTTAAT 


GGAAACAACT 


TTACCAAATG 


GTAAATCAGT 


TGATGAAAGA 


1380 


30 


ATTAAAGAAG 


CAATTTCAAC 


AATCGGTGAA 


AAATTAAGTG 


TTCGTCGTTT 


TGCTATCAGA 


1440 




ACTAAAACTG 


ATAACGATGC 


TTTCGGCGCT 


TACTTACACA 


TGGGTGOACG 


CATTGGTGTA 


1500 


35 


TTAACAGTTG 


TTGAAGGTTC 


AACTGACGAA 


GAAGCAGCAA 


GAGACGTTGC 


TATGCATATC 


1560 


GCTGCAATCA 


ACCCTAAATA 


TGTTTCTTCT 


GAACAAGTTA 


GCGAAGAAGA 


AATCAAC CAC 


1620 




GAAAGAGAAG 


TTTTAAAACA 


ACAAGCATTA 


AATGAAGGTA 


AACCAGAAAA 


CATCGTTGAA 


1680 


40 


AAAATGGTGG 


AAGGACGTTT 


ACGTAAATAC 


TTACAAGAAA 


TTTGTGCTGT 


AGATCAAGmT 


1740 




TCGTTAAAAA 


CC CTGATGT A 


ACAGTTGAAG 


CTTTCTTAAA 


AACAAAAGGT 


GGAAAACTTG 


1800 




TTGACTTCGT 


ACGCTATGAA 


GTAGGCGAAG 


GTATGGAAAA 


ACGCGAAGAA 


AACTTTGCGG 


1860 


45 


ATGAAGTTAA 


AGGACAAATG 


AAATAATCTG 


TCATAAAGTA 


AAACAAGGAA 


GAAGACACCT 


1920 




TTAATGTTGC 


TTTATTAAAA 


TGTAAATCAT 


TCTAATAAAA 


CGACAACTGT 


GTCTTCTTTA 


1980 




CTTGTATATG 


TTACATATAT 


TCACGATAGA 


GAGGATAAGA 


AAATGGCTCA 


AATTTCTAAA 


2040 


SO 


TATAAACGTG 


TAGTTTTGAA 


ACTAAGTGGT 


GAAGCGTTAG 


CTGGAGAAAA 


AGGATTTGGC 


2100 




ATAAATCCAG 


TAATTATTAA 


AAGTGTTGCT 


GAGCAAGTGG 


CTGAAGTTGC 


TAAAATGGAC 


2160 
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TTAGOTATOO ACCGTGGAAC TGCTGATTAC ATGGGTATGC TTGCAACTGT AATGAATGCC 2280 

TTAGCATTAC AAGATAGTTT AGAACAATTG GATTGTGATA CACGAGTATT AACATCTATT 2340 

GAAATGAAGC AAGTGGCTGA ACCTTATATT CGTCGTCGTG CAATTAGACA CTTAGAAAAG 2400 

AAACGCGTAG TTATTTTTGC TGCAGGTATT GGAAACCCAT ACTTCTCTAC AOATACTACA 2460 

GCGGCATTAC GTGCTGCAGA AGTTGAAGCA GATGTTATTT TAATGGGCAA AAATAATGTA 2520 

GATGGTGTAT ATTCTGCAGA TCCTAAAGTA AACAAAGATG CGGTAAAATA TGAACATTTA 2580 

ACGCATATTC AAATGCTTCA AGAAGGTTTA CAAGTAATGG ATTCAACAGC ATCCTCATTC 2640 

TGTATGGATA ATAACATTCC GTTAACTGTT TTCTCTATTA TGGAAGAAGG AAATATTAAA 2700 

OGTGCTGTTA TGGGTGAAAA GATAGGTACG TTAATTACAA AATAAATTTA GAGGTGTAAA 2760 

ATAATGAGTG ACATTATTAA TGAAACTAAA TCAAGAATGC AAAAATCAAT CGAAAGCTTA 2820 

TCACGTGAAT TAG CTAACAT CAGTGCAGGA AGAGCTAATT CAAATTTATT AAACGGCGTA 2880 

ACAGTTGATT ACTATGGTGC ACCAACACCT GTACAACAAT TAGCAAGCAT CAATGTTCCA 294 0 

GAAGCACGTT TACTTGTTAT TTCTCCATAC GACAAAACTT CTGTAGCTGA CATCGAAAAA 3000 

25 GCGATAATAG CAGCTAACTT AGGTGTTAAC CCAACAAGTG ATGGTGAAGT GATACGTATT 3060 

GCTGTACCTG CCTTAACAGA AGAACGTAGA AAAG AG CGCG TTAAAGATGT TAAGAAAATT 312 0 

GGTGAAGAAG CTAAAGTATC TGTTCGAAAT ATTCGTCGTG ATATGAATGA TCAGTTGAAA 3180 

30 AAAGATGAAA AAAATGGCGA CATTACTGAA GATGAGTTGA GAAGTGGCAC TGAAGATGTT 324 0 

CAGAAAGCAA CAGACAATTC AATAAAAGAA ATTGATCAAA TGATTGCTGA TAAAGAAAAA 3 300 

GATATTATGT CAGTATAAAA CTAATATACA ATGACATATT AAAATGCCAG TATTAAACGA 3360 
TAATGTAACA TTTAAAATGG GCATGTTTAA TTAAATCAAA GATGCATGTG . ATAATTTAAA . 3420 

TTCAGAATGA GCATAAAAAT GGTGTTTAAA CAAGTTAATT AAACATATAC TTTATAAATA 3480 

ATAGGCATTA GGTATATTGC TATAATAAAG TTATGTAATT TTTAACCTCA GTATGTATGT 3 540 

CACATTTCTG GTGTAAACTG TACCGAGTCA GACTTTGGTA CAGTTTTTTT ATTTGCTTAT 3600 

TCAATGCATT AAATGAGTAT GATAAAATGA TAATGATTGT TTAGTAACTT ATACTATATG 3660 

ACAGAGATGA TCAGGCTCGG AGGAAAGACC ATGTTTAAAA AGCTAATAAA TAAAAAGAAC 3720 

ACTATAAATA ATTATAATGA AGAATTAGAC TCGTCTAATA TACCTGAACA TATCGCTATT 3780 

ATTATGGATG GTAATGGGCG ATGGGCTAAG AAGCGAAAAA TGCCTAGAAT TAAAGGTCAT 3 840 

SO TACGAAGtAT GCAAACAATA AAAAAAATTA CTAGGGTAGC TAGTGATATT GGTGTTAAGT 3900 

ACTTAACTTT ATACGCCTTT TCCACTGAAA ATTGGTCAAG AC CTGAAAGT GAAGTAAA 3958 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5333 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 170: 

10 

ATTAAAACAA CTTAATATAC CTATTTATGG TGGTCCTTTA GCATTAGGTT TAATCCGTAA 60 

TAAACTTGAA GAACATCATT TATTACGTAC TGCTAAACTA AATGAAATCA ATGAGGACAG 120 

TGTGATTAAA TCTAAGCACT TTACGATTTC TTTCTACTTA ACTACACATA GTATTCCTGA 180 

1S 

AACTTATGGC GTCATCGTAG ATACACCTGA AGGAAAAGTA GTTCATACCG GTGACTTTAA 240 

ATTTGATTTT ACACCTGTAG GCAAACCAGC AAACATTGCT AAAATGGCTC AAXTAGGCGA 300 

20 AGAAGGCGTT CTATGTTTAC TTTCAGACTC AACAAATTCA CTTGTGCCTG ATTTTACTTT 360 

AAGCGAACGT GAAGTTGGTC AAAACGTAGA TAAGATCTTC CGTAATTGTA AAGGTCGTAT 420 

TATATTTGCT ACCTTCGCTT CTAATATTTA CCGAGTTCAA CAAGCAGTTG AAGCTGCTAT 480 

25 CAAAAATAAC CGTAAAATTG TTACGTTCGG TCGTTCGATG GAAAACAATA TTAAAATAGG 540 

TATGGAACTT GGTTATATTA AAGCACCACC TGAAACATTT ATTGAACCTA ATAAAATTAA 600 

TACCGTACCG AAGCATGAGT TATTGATACT ATGTACTGGT TCACAAGGTG AACCAATGGC 660 

AGCATTATCT AGAATTGCTA ATGGTACTCA TAAGCAAATT AAAATTATAC CTGAAGATAC 720 

CGTTGTATTT AGTTCATCAC CTATCCCAGG TAATACAAAA AGTATTAACA GAACTATTAA 780 

TTCCTTGTAT AAAGCTGGTG CAGATGTTAT CCATAGCAAG ATTTCTAACA TCCATACTTC 840 

35 

AGGGCATGGT TCTCAAGGTG ATCAACAATT AATGCTTCGA TTAATCAAGC CGAAATATTT 900 

CTTA€CTATT CATGGTGAAT AC CGTATGTT AAAAGCACAT GGTGAGACTG GTGTTGAATG 960 

CGGCGTTGAA GAAGATAATG TCTTCATCTT TGATATTGGA GATGTCTTAG CTTTAACACA 1020 

40 

CGATTCAGCA CGTAAAGCTG GTCGCATTCC ATCTGGTAAT GTACTTGTTG ATGGTAGTGG 1080 

TATCGGTGAT ATCGGTAATG TTGTAATAAG AGACCGTAAG CTATTATCTG AAGAAGGTTT 1140 

45 AGTTATCGTT GTTGTTAGTA TTGaTTTTAA TACAAATAAA TTACTTTCTG GTCCAGACAT 1200 

TATTTCTCGA GGATTTGTAT ATATGAGGGA ATCAGGTCAA TTAATTTATG ATGCACAACG 1260 

CAAAATCAAA ACTGATGTTA TTAGTAAGTT AAATCAAAAT AAAGATATTC AATGGCATCA 1320 

60 GATTAAATCT TCTATCATTG AAACATTACA ACCTTATTTA TTTGAAAAAA CAGCTAGAAA 1380 

ACCAATGATT TTACCAGTCA TTATGAAGGT AAACGAACAA AAAGAATCAA ACAATAAATA 144 0 
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OCTTTTTCTT TATATATGAT GAQCTTGAGA CATAAATCAA TGTTCAATGC TCTACAAAOT 1560 

TATATTCGCA GTAGTTGACT GAACGAAAAT GCGCTTGTAA CAAGCTTTTT TCAATTCTAG 1620 

TCAGGGGCCC CAACATAGAG AATTTCGAAA AGAAATTCTA CAGGCAATGC GAGTTGGGGT 16 80 

GTGGGCCCCA ACAAAGAGAA ATTGGATTCC CAATTTCTAC AGACAATGTA AGTTGGGGTG 1740 

GGACGACGAA ATAAATTTTG AGAAAATATC ATTTCTGTCC CACTCCCGAT TATCTCGTCG 1800 

CAATATTTTT TTCAAAGCGA TTTAAATCAT TATCATGTCC AATCATGATT AAAATATCAC 1860 

CTATTTCTAA ATTAATATTT GGATTTGGTG AAATGATGAA CTCTTTGCCT CGTTTAATTG 1920 

CAATAATGTT AATTCCATAT TGTGCTCTTA TATCTAAATC AATGATAGAC TGCCCCGCCA 1980 

TCTTTTCAGT TGCTTTCAAT TCTACAATAG AATGCTCGTC TGCCAACTCA AGATAATCAA 2040 

GTACACTTGC ACTCGCAACA TTATGCGCAA TACGTCTACC CATATCACGC TCAGGGTGCA 2100 

CAACCGTATC TGCTCCAATT TTATTTAAAA TCTTTGCATG ATAATCATTT TGTGCTTTAO 2160 

CAGTTACTTT TTTTACACCT AACTCTTTTA AAATTAAAGT CGTCAACGTA CTTGATTGAA 2220 

TATTTTCACC AATTGCCACA ATGACATGAT CAAAGTTACG GATACCTAAA CTTTTCATAA 2280 

25 CTGCTTCATC TGTAGTGTCT GCAACAACCG CATGAGTAGC GATATCACTA TATTCATTCA 2340 

CTCTATTTTC ATCATGGTCG ATGGCCATTA CATCCATGTC TAATGCATTC AACTCACGAA 2400 

CGATACTACC TCCAAAACGA CCTAGACCGA TGACTACATA TTCTTTACCC ATACTCGCCC 2460 

30 TCCATTAAAT GATTTTCATC AATTCATTGA AAATATAAAT . TTAAAATTAT TATAAATGAG 2520 

TACCCCAACT AAATTATCTA AATGCAGTAA TGCAAGTAAA TGAAAGTTGG GGTATCGTCT 2580 

CAACTTATGA TTTCTTTCCT TCAACATATT CTTTGTCGAA AACAAATAAT CTTAATAATA 2640 

ATATTAACGA TGGAAGTAAT AAAAGTAAAC CTAAAATAAA GACAATCACT AATGTCCAGC 2700 

CCACTTCTGG ATTAACATAT GCATCTGTAA TTTTTACAAA CGGATATAAA AGGTATGGCA 2760 

ATTT ACTAAT TCCATAGCCA AAGAACGCGA ACATCATTTG TAAAATAACA AATACAAAAG 2820 

CCAAACCATG TTTTTTCTTA AAGAATGTTA ACAATGAAGC TAATGCAAAG AATAAGAAAC 2880 

TTATACCAAA CATCCACCAA TAGTCAAAAA CAGCTGAATA AAAATGTTCA GAATTTTGAA 2940 

TGCGTAATGA TAGAAATACG AATAAACAAA TGATAATCAT CGGCGGCCCT AAAAATATGT 3000 

GCCATTGTCT TGTTAAATTA TATGCTGGTT CGTCATTTGC TTTTTTAGCA TAATATGTCA 3060 

AAAATCCTGA TGAAATATAT AAAACTGAAA TAATTGCCAA GAATACTACA GACCAAGCAA 3120 

GO ATGGGCTTAA TAATAACTGC ACCCAATCTA GATCGATAAC ATTGTTTCGA ACATTAATAT 3180 

AGCCACCTTC TGTAATAGTT AAAGCAGTAG ATAATGAAGC TGGAATTAAT AATCCACTTA 3240 
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AACTGTTTCT CAACGATATC ATAATCAGTG CTATTGAACC TGOTATTAAC AATACCGTGC 3360 

CTAAATATTT GATTGACTCT GGAAAGAAAC CTACGAATCC TACGAAGAAG AAAACAAAGA 3420 

5 ATACATTCGT AACTTCCCAA ACTGGGTTTA AATAACGTGA AATTAAGTGA TTAATTTTCT 34 80 

TTTCATCACC AGTTAACTTT GAATGCAATG CGAAGAAACC TGCCCCAAAA TCTATAGAAG 3540 

CAATAATGAT ATAGCAAAAT AAAAACAACC ATAACACTGT TATACCTATA AATGCATAAA 3600 

10 TCATTTTTCT ATTTCTCCTC CTTGCTTCTT GGCTAAACGA TTTACATCTT CATACG CCGG 3660 

TTTATTTTTA AACATACGAA TTAATACGTA TGCACATGTA TACATTAAAA TGATGTACAA 3720 

TATGC CAAAT AAAATTGTAA CGAaGGTTAT TCCGCCTGCT TGTGTTGCTG CTTCTGCCAC 3780 

15 

GCGCATATAA CCACGAACAA TCCAAGGCTG TCTACCCATC TCTGTTAAGA ACCATCCAAA 3840 

TTCTATAGCT AG CATTG AAG CTGGGCCTGT TAATAATATT CCATAAAGCA TCCATTTATG 3900 

AGTAGAAAAC TTTCTAAGCT TTTTAAACAT TAAAGTTAAG ACATAAACAC CTGAAATGAC 3960 

20 

AAAACATAAA ATTCCCATCG TTACCATTAA ATCAAAGAAA TAATGGACGA TCATAGGCGG 4020 

ATGTAAACTT TTTGGAAAAT CATTTAACCC TTGTACTTTA GTTTTGACAC TATTAT CTGC 4 080 

2S TAAGAAACTC AATAGTCCAG GTAATTCAAT CGCACCTTTA ACTTGCTGAG TCTTTTCATC 414 0 

TAACACACCA AATAATAATA ATTTGGCATG GGAAGATGTA TCGAAATGCC ATTCATAAGC 4200 

TGCTAATTTT TCAGGTTGGA ATTTATGCAA AAATTTTGCA GATAAATCCC CTGCCAACAT 4260 

30 AGAAAGTAAT GTTGAAAAGA ATCCAACTAT CATAGACATT TTCAAAGCTT TCTTATGGTA 4 320 

GACAGTATCT TTAGGTTGAC GATTACGCAA TAATTTAAAA GCTGCTATTG ATGCAATAAC 4 380 

AAATGCCATC GTCATACCGG CTGTAGTAAT TACGTGAAAT GATCGAACTA TAAACGATGG 4440 

35 ■ 

GTTAAAGATC GCTTCTATAG GTTGAACATT GACCATCTTT CCATTCTTCA ACTCAAAACC 4500 

TGCAGGCGTA TTCATAAATG AATTCACTGA AGTAATGAAG AATGCTGAGA AAGAGCCACC 4560 

AATAATTACT GGTATACTAA TTAAGAAATG TGTC CATTTA TTTTTAAAAC GATCCCAAGT 4 620 

40 

ATATAAATAT ATACTTAAGA AAATAGCTTC AAAGAAGAAC GCAAATGTTT CCATAAATAA 4 680 

TGGAAGTGCA ATAACGTGTC CACCCATTTC CATAAATGTA GGCCAAATCA ATGATAATTG 4740 

AAGTCCTATA ATTGTACCTG TAACAACTCC CACTGCTACA GTAATTGTAT AAGCTTTAGC 4 800 

45 

CCATCTTTTG GCCATAGCTA TATATTGAAG ATCATTTTTG CGAAT AC CT A AAAATTCTGC 4 860 

AATTGCGAAC ATTAAAGGCA TACCAACACC AATCGTTGCA AAAATGATAT GAACTGCTAA 4 920 

60 AGTCATAGCT GTCAAAAACC GACTGATTTC AACTGTATCC ATTTAAAAAC ATCACCTTTT 4 980 

TCTTTTTTTG ATGACAACAC AATGAACTTA ATTATAATTG CTATAATGTG TATTTTTAAA 5040 
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GAATTTCAAT GTATAATTGT GTATATTACA TTAGAATAAA GCACGAAGGA GCATGATACA 5160 

TGTCAGAAAT AATCGTTTAT ACGCAGAATG ATTGTCCACC TTGTACATTT GTAAAAAATT 5220 

5 ATCTAAATGA GCATCACATT GATTTTGAAG AGAGAAATAT CAACAATCAA CAATATCGAA 5280 

AOGAAATGAT AGATTTTGAT GCTTTTTCAA CTCCGTTTAT TTTGTTGAAT GGC 5333 
(2) INFORMATION FOR SEQ ID NO: 171: 

10 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11126 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 171: 



20 


ATACGTGACC 


CTTTATCCGA 


AAATTTCTTT 


TCATATTCTG 


TTAAAATATT 


ACTGCCATCG 


60 




TCTTCTTGAT 


GTAAATTTAG 


ATTTATTTTT 


GTAAAATACA 


TTCCAAATTG 


AGACATACTT 


120 




TCTAAACTGT 


AGGGAAATAG 


TCCTCTGTTA 


TCAGTTTTAA 


AATGTAAATC 


TCCTTCATCA 


180 


25 


X 1 lAAbAl 1 I 


<J 1 ITjAlAVw-AA 


CGCTAAAAAC 


GTATGATACG 


TTAAACGTCG 


TTTTGCATGA 


240 




CGATTTT1TG 


GCCATGGATC 


TGAAAAGTTC 


AAATAAATAC 


GCGAAACTTC 


GCCGTCTTTA 


300 




AAATATTCAT 


TTAATTCAAT 


GGCGTCATTA 


CAAATAATCT 


. TTAAATTTGT 


TAAACCCATC 


360 


30 


TCTTTAACTT 


TATCCAATAC 


TTTATAAACG ATACTTTTCT CACGTTCCAT TGAAATATAG 


420 




TTAATATGAG 


GATTTTGAGC 


AGCTAATGTT 


GTAATAAACT 


GCCCCATACC 


CGAACCAATT 


480 




TCAATGTGTA 


TCGGTTGCGT 


TTTaTCAAAC 


CATTCAGTCA 


TTTTCCCTGc 


ATGTTGACCG 


540 


3S 


TCCATGTCAA 


CCAATTCAGG 


ATGATCTTTT 


AAATAATCTT 


CAGCCCATGG 


TTTGTATCGA 


600 




ACTCTCATAT 


TTTATTCTCC 


TCTTAAATAA 


ACATGTTACT 


ATTCATAACT 


TCATTTAGGA 


660 


40 


ATTTAAGCCA 


AGTGTTCATA 


TCCTTATATC 


rrriTTGcrc 


TTCATACCAT 


TGAACAAGAC 


720 


CTATAGATTG 


AATTACCGTA 


TACCATTTCA 


TACGTTTATT 


TAAATTCAAG 


CTCTCTTGAA 


780 




CACCATATGT 


TTCAAGCCAT 


TCAGACCATT 


GTTGTTGTGG 


AACATAGTTG 


TAAAGCAGCA 


840 


45 


TTCCGATATC 


AATTGCCGGG 


TCTGCAATCA 


TTGCACCTTC 


CCAATCAACT 


AAAAATAGTT 


900 




CATCTCGATC 


GGATAATAAC 


CAATTATTAT 


GATTCACATC 


ACCATGTACA 


ACAGTGAAAA 


960 




AACGCGAATC 


TAAACTCGGT 


ATATG CTCTT 


CTAAATAGGT 


TAATGATTTT 


CTCACAATAT 


1020 


50 


GATGTGTTAA 


AACTTCTCTT 


GATAAAGAGG 


CATTAATTTT ATTAAGCATA 


ATCTCAGGAG 


1080 




TAATAGGTTC 


CATTTCCATA 


CGCTTTAACA 


TACTTAATAA 


AGGTCTAGAA 


TTGTGTATCT 


1140 
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TTGTGCTGTA ACAACCTCGC 


CTGTTTCTAT 


1 GCGTTTCGTC 


CATACTAATT 


1260 






ACCTTCTGCT 


GATAATGCCG 


CAATAAATGG 


ATTTGAATTT 


CGTTTTAAAA 


1320 


6 


ACAACTTTTG 


TCCATCTTGT 


TCAG CCATAT 


ATGCTTCACC 


AGATGCACCA 


CCTGCTGAAT 


1380 




UUlw I vj 1 t-VjA 


CCCTAATTGA 


TAAAACTGCT 


CCAACTCGTC 


CACCTCACTT 


TCAATTAGAA 


1440 


10 


AATGG CTCTA 


GAAATAGGTT 


TTTCAAGAGC 


CATATATTCT 


AATTTATAAC 


AC CATACTGG 


1500 


W ft. ft n * m « mm 

TACAAATATT 


ATGTCCAGAT 




AATCCTCAAC 


CAATGCCTAC 


ATTACACGAC 


1560 




TAAATTTAAA 


TCGTAATGTC 




ACCATACATT 


CTATAGTCAC 


TTACTTGACA 


1620 


15 


TATAATGTTA 


CCGTGTCTAA 




TTTTGAATCT 


CTGTAGGCGA 


TAAACTcTAG 


1680 




TTTTCAAAAT 


AATTGCTATC 


CCATTTTCAT 


GGTTAGCATA 


AATTTATGAA 


CTGTAACATT 


1740 




TACGTACTTA 


GTAAAATATG 


& ^V?0 ft. /*i ft. rrv* K 

ATGCACATCA 


TATTTGTrAC 


TCATAGAAAA 


TTTTATAAt T 


1800 


20 


TTTATCATTA 


TATTTCAACT 


GAAAATGAGA 


AACAAAATGG 


CACTTTTTAC 


TAATATGTGT 


1860 




TTTCTAAACA ACACTTTTAA 


GCTTCGTTTT 


AAATTATAAC 


ATAATTCACT 


TACGAAAGTT 


1920 




GATAAATTTA 


AGTAATTTAA 


TCTAAAAATA 


TGATGAAAGA 


ATTTTAAATA 


CTGTGTGACT 


1980 


25 


CTATATACTT 


TTCAAAT CCT 


T CTTGTAG TT 


GACGTGTAAT 


TGGGCCAACT 


TTACCATCAT 


2040 




TAACTOGTTC 


ACCATCTAAT 


TT AAT AA CAG 


GTGTAACCTC 


AGCTGAAGTA 


CTTGAAACAA 


2100 




TAACTTCATC 


TGCGTTTTTC 


ft ft M ft ft ft ft 

AAGAAATCTA 


CAGTAAACGT 


TTCTTCTTTA 


AATGGGATGT 


2160 


30 


TATAGTCTTC 


GG CAATTTTT 


*T*»T*7l T\ KWtlft A* ft ft 

TTAATTACAA 


TTCGTGTAAT 


ACCATTAAGA 


ATATAGTTGT 


2220 




TAATCGGATG 


TGTATAAATC 


ACACCGTCTT 


T AATTG CAT A 


AG CATT ACTT 


GAAGATCCTT 


2280 


35 


CAGTTACAGT 


TtCACCTCGA 


TGTTGAATTG 


CTTCAACTGC 


ATTATATTTC 


ACAGCATATT 


2340 


CTTTTGCTAA 


TACATT CTCC 


TAATAAGTTC 


AAGCTTTTAA 


TGTCGCAACG 


TAACCATCGG 


2400 




ATATCTTCAA 


CGGTAACACC 


ATTCACACCA 


TTTTCTAAAT 


GATCATAAGG 


ACGATCATAA 


2460 


40 


CTCTTTGTAT 


AAGCAACAAT 


TGCTGGTTCT 


ACTTCAGGTG 


TCGGGAAGCT 


ATGATTCCTT 


2520 




TCAGCTACAC 


CACGCGTTGC 


TyGAATATAA ATTGCCCCAG 


TTTCAATTTG 


ATTCATATCA 


2580 




ACTAATTTAC 


GAGATAGTTC 


AATTAATTCT 


TCTACAGAAT 


AATTTAAATC 


TAAACCAATC 


2640 


45 


TCATTGGCAC 


TACGTwAAAw 


TCTTTCATAA 


TGTTCTGTTA 


CTGTAAATAA 


CTTACCATTA 


2700 




TATACTCGAA 


TGTATT CAT A 


AATACCATCG 


CCAAATACGT 


ATCCTCTGTC 


GTTGTATGAA 


2760 




ACCTTTGCTT 


CACTTGGACT 


TACAAACTCA 


CCATTTAAAA 


AAATTTTTTC 


CATATATTAT 


2820 


60 


TCCTCCACGC 


ATAATGAATA 


AATTGCTTCT 


AAGTAAATAC 


TAGTTGCGTT 


AAATAACTGT 


2660 




TTTTTAGTGA 


TATATTCATT 


TTTCTGATGC 


ATTAAATCTT 


CAGAATCACT 


AAACATTGCG 


2940 
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TCAGTCATAT CATTTGTTTG ATTTCTATAT GCAGTAACTA ACTTTTGTAC AAAAGGATCA 3 060 

TTTTTATCAA CATAATGTGG TGGTTGGACT TTACCTAATT TCACTTCAAA GCCATATTGT 312 0 

5 TGAATCTCAT TTGCAAAACG ATCCATAGCT TTTTCAAATT CAAATCCTTC TGGGTAGCGT 3180 

AAGTTGATAC CGAAAAGACC TGCGTTTTCA TTATCATATG TAATAACACC AATGTTAGTT 3240 

GTCACGTCAC CCATGACATC TGTATGGAAT TTCATTCCCA TCTTTTCACC AAAATCTGAA 3300 

10 

TTAAATAAGT AGCGATTACT AAATGCTACA AACGCTTGTG CATTATTATC AAGATTTAAT 3360 

GATGCTAAGA ATTTTAGTAA GTAAAGACCC GCATTCACAC CGATAGATGG ATCCATACCA 342 0 

TGAACCGCTT TACCTTCAAC TGTTAAAACT AGAATGCCAC TATCAACAGT ACTATCACCT 3480 

15 

TGTAAATGAT TTTGTTCTAA AAAGTACTCA AAGTCTTGAA TAACATCTGT CATATTTTCT 354 0 

TTAACAAGCA CTCTTGCTTC TGCATGATCA GGTACCATGT TGTAACGTTC ACCAGATTTA 3600 

20 AAAGTTATTA ATTCATAATC AGGTTCATCT TGATCTTCAG TAAGTTTATT TTGAACTAAA 3660 

TCAAATGTTG TAATGCCTTT TTCACCATGA ATACATGGAA ATTCTGCATC TGGTGCAAAA 3720 

CCTAATGTTG GCATTTCTTC TGTTTTAAAA TAG CGATCCG TACATTTCCA ATCAGATTCT 3780 

25 TCATCCGTAC CAATAATCAT ATGAATACGT TTCTTCCAAT CCACATTCAT ATCTTCTAAT 3840 

ATCTTAATTG CATAATAAGC AGCAATTGTT GGACCTTTGT CATCAAGTGT ACCTCTAGCT 3900 

ATGATAGCAT CTTCTGTTAC AACCGGCTCG AACGGATTAC TATCCCATCC ATCACCAGCA 3960 

30 GGAACAACGT CAACATGACA TAAGATACCT AATACGTCAT TTCCTTTACC TGCCTCAATT 4020 

CTTCCTGCAA TATGATCCAC ATCATGTGTT GTAAATCCAT CTCTATGTGC AATTT CATAC 4 080 

ATGTAGTCTA ATGCCTTACG AGGACCTGGA CCAACTGGTG CGTCTTCTGA TGCTTTTGCA 414 0 

35 

TCATCTCTCA CACTTTCAAT TGCTAATAAT CCTTTTAAGT- CATTAATGAT TTGATCTTCG 4200 

TATTGTTGAA CTC T TTCTTT CCACATTCGA AATCGACTTC CTTTTTTCTA TAAGTTAAAT 4260 

TCTATTTTAC ATGAAAAGAT ATAAAAACTA CAATAAGATG TCAGAAAATA ATAAAAAGGA 432 0 

40 

ACAAAACGAT GCTATTGATA TGACACAAAT CATAAATAGC TGCTTTGTTC CTTTTTTAAT 4 380 

TTATATATTT AAAATACACA TATTCAAGAG CTCGAGATAT AAGTCAATGT ACTAGGCACA 4440 

45 CAATTTAATA TTGACAGTAA TTAACCGAAC GAAAATGCGC CCCGGGGCCC CAACATAGAG 4500 

AATTTCGAAA AGAAATTCTA CAGACAATGC AAGTTGGCGG GGCCCCAACA TAGAAGCTGG 4560 

CCAATAGTTA GCTTTCAATA ATGTGCAAGT TGGGGTAAGG GCCCCAACAC AGAAGCTGGC 4620 

SO CAATAGTCAG CTTTCAATAA TGTGCAAGTT GGGGTAAGGG CCCCAACACA GAGAATTTCG 4680 

AAAAGAAATT CTACAGACAA TGCAAGTTGG CGGGGCCCCA ACACAGAAGC TGGCCAATAG 4740 
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TAAAGAAATA CGTTTTCTTT AGATATTAGT ATTTCTTATG AATGAGTTTC ACGCATGTAT 4860 

TCTTCTTTCT ATATGCATAT TAGCTATOAC TAACGATAAA GAACCTGAAA CACTAATAAA 4 920 

5 TGTCCTATAG TTTACAATAT TATATTGGCA GTAGTTGACT GAATGAAAAT ACGCTTGTAA 4980 

CAAGCTTTTT TCAATTCTAG TCAACCTTGC "CGGGGTGGGA CGACGAAATA AATTTTGCTA 5040 

AAATATGATT TCTGTCCCAC TCCCTTATCA TTTCTGTCCT ACTCACATCT TATTCTTTAT 5100 

TO 

CAGATAATGC ATTTTTATTC TTTTTTAAAT CTTCTTCAGT GACGATACGT AAATTATTAT 5160 

TTGGTGTGCG CCACCTTCAT CATCAAATTT ACCTTTTTCA ATACTTTCGT CAGTCTTATT 5220 

GTCATATTCG GTAAATTTTG ATTTTTCTTC TTTGAAAAAT GCTTTTGGAT TATTTTTTAA 5280 

75 

TCTATTAGCA TATTCTTTCG GATTTGTTTT TACTTCTTTA ATTGTTTCAT TAGCAATTGT 5340 

TCCTAATTGC GTCGCTTTAT CCTTAGCATT ATCTTTATAG CTTTGAGGAT CTTGTTTATA 5400 

2Q TTTATTATAT TCcTGcTTTC AGCTTGTCAC GACTATCTTT ACGTGTAACA AGTACAGCTG 5460 

CTACAG CG CC ACCTATACCT AAAATCGCTT TAAATAAATT ACCTTTTGCC ATATCAATCG 5520 

TCTCCCTTTT ATTTATAATT TAATTTGTCA AAATCATTTT CAGTTAATAA ACGATATTCT 5580 

25 CCTGAATCTA AATTGCTGTC CAATTCTAAA TCAGCAATTT TGATACGTCT TAAATGTAAT 564 0 

ACCTCATTTT GAATGCTATG AAACATTCGT TTAACTTGAT GATATTTTCC TTCATAAATT 5700 

GTTACGTGTG ACGTTTGATT ATCAATATAA GTTAATATTG CAGGCTTAAC CTTGCCATCA 57 6 0 

50 GTCAGTGTtA CACCCTCTTT AAAAGCTTGA ATGTCGTCTT CAGTGATAGG ATTTGCTGAA 582 0 

ATAACTTCAT ATTTT TT AG A AACATGTTTG TTTGGACTCA TTAATTCATG ATTAAAATCA 58 8 0 

CCATCATTCG TT AT CAAT AA AAGCCCTTCT GTATCTTTAT CAAGACGACC AACCGGAAAA 594 0 

35 

ATATTTAGAT GTTGGTATTC AGGTATTAAA TCAATAACGG TTTTTGAATG ATGATCTTCA 600 0 

GTTGCTGATA TATAACCTTT TGGCTTATTT AACATAATAT AG ACATTTT C AATGTATTCT 606 0 

ATTAATTCTC CACGAACTGT TATCTTATCG TTTTCTGGTT CTATATGTGT TTTTGGTGAT 6120 

40 

TTAATTACTT GTTCGTTGAC ATTTACAAGG CCTTTTTTAA GTAACTGTTT GACCTCATTA 6180 

CGTGTACCGA CGCCCATATT TGCTAAAAAT TTATCTATTC TCATCGTAAA AACCTAACTC 624 0 

TACGTCTTAA TTTTTCAGGA ATTTCACCTA AGAATTCGTC CGCAAOACGC GTTTTAATTG 63 00 

45 

TGATTGTACC GTAAATTAGA ATACCTACTG TAACACCTAA AATAATAATG ATTAAGTAAC 6360 

CAAGTTT AG T AGGTTCTAAG AATAGATTTG CAAGGAAAAA TACTAATTCT ACACCTAGCA 6420 

50 TCATAATAAA TGAATACAAG AATATTTTTG CAAAATGAAT CCAACTATAG CTGAATTTAA 64 80 

ACTTCG CAT A TTTTTTAAGA ATATAGAAAT TACATCCAAT TGCAAATAAT AATG CG AT AC 6540 
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ACTTGATAAC TACAGAAGCT AAAATAACAT AAACTGTTAA TTTCTGTTTA TCTATACCTT 6660 

GTAACATTGA TGCCGTTACA CTTAATAGTG AAATTAGTAT TGCTACAGGC GCATAATAGA 6720 

ATAATAAGCG ACTACCATCA TGGTTAGGGT CATGACCTAA AACAATTGGA TCGTAACCAT 6780 

AOAAAACTGT GAATAATGGT TGTGCCAAGG CCATAATTCC AATACTAGCT GGAACAGTTA 6840 

TAAACATTAA TACACCAATA GATGTTCTAA TTTGATGATG CATTTCATGT AAGCGACCTT 6900 

CTGCAAATGT TTTTGTAATA TAAGGAATTA AACTCACTGC AAAACCAGCA CTTAATGATG 6 960 

TCGGAATCAT TACAATTTTA TTAGTTGACA TATTTAGCAT ATTAAAGAAT ATATCTTGTA 7020 

ACTGTGAAGG TATACCAACT AAAOATAAAG CACCGTTATG TGTAAATTGA TCTACTAAGT 7080 

TAAATAATGG ATAATTCAAA CTTACAATAA CGAACGGTAT ACTATAAGCA ATAATTTCTT 7140 

TATACATCTT GCCATATGAC ACATCTATAT CTGTGTAATC AGATTCGACC ATACGATCAA 7200 

TATTATGCTT ACGCTTTCTC CAGTAATACC AGAGTGTGaA TATACCAATA ATCGCACCAA 7260 

CTGCTGCTGC AAAAGTAGCA ATACCATTGG CTAATAAAAT AGAGCCATCA AAGACATTTA 7320 

GTACTAAATA ACTTCCGATT AATATGAAAA TCACGCGTCC AATTTGCTCA GTTACTTCTG 7380 

25 ACACTGCTGT TGGCCCCATA GATTTATAAC CTTGGAATAT CCCTCTCCAT GTCGCTAATA 7440 

CAGGAATAAA GATAACAACC ATACTAATGA TTCTTATAAT CCAAGTAATA TCATCGACTG 7 500 

ACCAACCGTT TTTATCATGA ATGTTTCTAG CTAATGTTAA TTCAGAAATA TAAGGTGCTA 7560 

30 AGAAATACAG TACCAAGAAA CCTAAAACAC CGGTAATACT CATTACAATA AAACTCGATT 7620 

TATAAAATTT CTGACTTACT TTATATGCCC CAATAGCATT ATATTTCGCA ACATATTTCG 7680 

AAGCTGCTAA TGGTACACCT GCTGTCGCAA CTGCAATTGC AATATTATAT GGTGCATAAG 7740 

35 

CGTATGTGAA CGGCGCCATA TTTTCTTGTC CACCAATTAA ATAGTTGAAT GGAATGATaA 7800 

AAAGTACGCC CAATACCTTG GTAATTAATA TACTAATGGT AATTAAAAAG GTTCCACGCA 7860 

CCATTTCTTT ACTTTCACTC ATTACGAATC TCCCTATCTC ATGTTTATTA AAGTTTTGTA 7920 

40 

AACTAAAAGC TGTTTCTCTG TAAAATCATT TTTCATTATT ATGAATATAT CACAAAACTT 7980 

TATTTCATTG TCGTATATTC AATGAATTAT CATAACAAAA TTATCAACAC ATTGTCATTG 8040 

AATACTAGAT TTTGATTAGA ATATTACGAA ATTTCATATA AACATTATAC TACTATTTGA 8100 

45 

GATGAACATC GCATAACAGT- AGAAAAATCA TTCTTATCAT ACACATACAT CTTCATTTTT 8160 

TATGAAGTTC ACATTATAAA TATATTCAAC ATAATTGTCA TCTCATAACA CAAGAGATAT 8220 

SO AGCAAAGTTT AAAAAAGTAC TATAAAATAG CAATTGAATG TCCAGTAACA AATTTGGAGG 8280 

AAGCGTATAT GTATCAAACA ATTATTATCG GAGGCGGACC TAGCGGCTTA ATGGCGGCAG 8340 
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25 



30 



35 



45 



60 



GTAAACTCAA AATATCTGGT GGCGGTAOAT GTAACGTAAC TAATCGATTA CCATATGCTG 84 60 

AAATTATTAA GAACATTCCT GGaAATGGGA AATTTTTATA TAGTCCCTTT TCAATTTTTG 8520 

ATAATGAATC CATCATAGAT TTTTTTGAGT CTAGGGGTGT TAAATTAAAA GAAGAAGATC .8580 

ACGGGCGTAT GTTTCCAGTT TCCAACAAAG CACAAGACGT GGTTGATACA TTAGTGACAA 8640 

CTATCGAACG CCAACATGTA ACGATTAAAG AAGAAGAAGC TGTTAGTAGA ATCGAAGTTA 8700 

ATACAGACCA AACTTTCACT GTACATACTC AAAATAATAG TTATGAAAGC CATTCGCTAG 8760 

TGATTGCTAC AGGTGGTACA AGTGTCCCTC AAACTGGTTC AACTGGTGAT GGTTATAAGT 8820 

TCGCACAAGA TTTAGGT CAT ACCATTACTG AGTTATTCCC GACCGAAGTT CCAATTACAT 8880 

CAGCTGAACC TTTCATCAAA TCCAATCGTC TAAAAGGTTT AAGTTTAAAA GATGTTGAAT 8940 

TGTCAGTACT TAAGAAAAAT GGTAAAAAAC GCATCAGTCA TCAAATGGAT ATGTTATTTA 9000 

CTCATTTTGG TATCAGTGGT CCAGCTGCAT TAAGATGTAG TCAGTTTGTT TATAAAGAAC 9060 

AAAAAAATCA AAAGACACAG CACATTTCTA TGGCAATCGA TGCATTTCCT GAATTAAACC 9120 

ATGAACAATT AAAACAACAC ATCACATCAT TATTATCGGA CACACCAGAT AAAATCATTA 9180 

AAAACAGTTT GCATGGTCTA ATTGAAGAGC GCTACTTACT GTTCATGCTG GAACAAGCAG 9240 

GAATCGATGA AAATACCACA TCACATCACT TATCAAATCA ACAATTGAAC GACTTAGTAA 93 00 

ATATGTTTAA AGGGTTTGTA TTTAAGGTGA ACGGGACATT ACCTATAGAT AAGGCATTTG 93 60 

TCACAGGTGG TGGTGTGTCA CTTAAAGAAA TTCAACCTAA AACAATGATG TCTAAATTAG 9420 

TTCCGGGATT ATTTTTATGT GGTGAAGTAT TAGATATACA TGGTTATACT GGTGGTTATA 94 80 

ATATTACAAG TGCACTCGTA ACAGGACATG TCGCTGGATT ATATGCCGGA CATTACTCAC 954 0 

ATGCATCAAT GGAATAATAG TATAAAATTT GGTTCX3ATTC TCTTTAGTAG ATCAACTTTT 9600 

TCATTCAAAT AAAAATGACC TTAATATAAC TGAGTCACTA AAAAGTGTCG TTATATTAAG 9660 

GTCATTTCGT TAATTATGAT TCTTTTTCGT TTTTAGTACG TCTTCTAGCT AACAAAGCCG 972 0 

CACCTGTAAT CAGTGCAAAT TCTTTCAATG GTAAATCCAT TCCTTCAGAA CCTGTATTTG 9780 

GAAGTTCTTT TTCAACTTTG CGCGATTCAT GTGTCTCTTC TTTTTTAATA GGCGTACAAA 9840 

CTTTTGGAGC TGGCTGAATT TCTTTTGGTG ATACTTTCGT CGCTTCAGCT GGTAATTTAA 9900 

TTGCTAAAAT TTCATCAACA ATGAATTGCG TGTGTTGTTT GATGTCATTT AATGTCGCAT 9960 

CTTCATCAAT CATTCTATTG CCATCTGCAA CATATTGATC AATTAATACT TTTACTTTAG 10020 

CTAATTGTTC TGGTGTTGCG ATCGCTTTGA ATTTCG CAT A TGTTTGTTGA GCAATGTTAT 10080 

CAATTCGCAG TAAGCTATTT TCTTTTTCAG TAATTACTGC TTCTATATCG CTTAATGCAA 1014 0 
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CATCCATTTG TAATTTTAAA GCAGTTATAG CTTTTAATGC ATCAGCCTTA TTACGATTAC 10260 

TTACTTTTCG ATAATTTTGC ACTAAAGCAG TGACGCGTGC AAGATCATCA TTAATCGTTT 10320 

TTTCAGCATC TGGCTTTTTA ATAGGATGTA CATCTAAATC ATGTATTGTT TGTAGATTTA 10380 

ATGATGCTGT TTTATCAACT TGTGCATTGC TACGATCTTG ATCAATTTGT CCAATAGCAG 10440 

TGTCATAAAT ATTTTGTAAC TGTGCTAATA TACTATTTCT TTCTTCTACC GTTGCTTGAA 10500 

TATTCGCTTC AATTGCTTGT TTTTTATCGT TGAATAATGT TGTCAATTGT TCTCGAGCAG 10560 

ACGCCTTTCT GTTAATAACA GGTTCGATTT CACGAATTTC GTTTTTCTCA TCATGCAATA 10620 

AATATGCCAC ATCTGCATTA GTCACTGCAC TAGCAATTTG TTGTTTAGCT TTAATTAACT 10680 

CTTTTTCAAC TTGTGCTATT GCAATATTTT GTTCTTCATC TGTCGCTTCG TTATTTGCTT 10740 

TAATTAAATT AATTTTATTT GTAGCGATAT TTTGAATTTG TTGTAATGCT GTTGCTTTAA 10800 

CTGTTGTCGC TGGTTTAATT TTTGAAATAA TATTTTGAGC ATTTATACTA TCTTGATTAA 10860 

CTTGGGCAGT CTTATCTGCA TGATTGATCT GATCAATAGC CTGATTAAGT GCTTGTTCTA 10920 

CTAAATGTTT AGCAGCTAGT CTTTCTTCTT CAGTTGATAA ATCGCTTTGA TCGATTAGTG 10980 

CATTTTGAGC TTCGGCTTTT ACACCAACAG ATTGACGCGC TGCTGGTTTA ACTTGAACTT 11040 

TAGGTAAAAT CACTTTGATG TTGTCGTTGC CATCAGTCnC AGTnCGATCC ACTTCTGCAT 11100 

TCGTTTTGTT TTGTGCAATG TCATTT 11126 
(2) INFORMATION FOR SEQ ID NO: 172: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3660 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 172: 

40 

TTGCCCCGCA CGGCGGTGTG nTTCCTAGAA ATAATGAATA TAAAGaGAAA TATATAACAA 60 

OGATTTTGAA TTATGAACCT GGTGATATCG TTACAATCAA ACGTGTGAGA GATAAGACCG 120 

45 ATTTGCTAAT ATATTTGTCT AGTAAAGATA TTTCTATTGG TAATGAAGTG GAAATTGTAT 180 

CGAAAGATGA AATGAATAAA GTAATTATCA TTAAACGTAA TGATAATGTA ATTATTGTCA 240 

GTTACGAAAA TGCAATGAAC ATGTTTGCTG AAAAATAAAA TAAAGAAGCC ATAAAGATAT 300 

SO CCATGATTGA ACTGATAAAG ACATATGGAT AATTGCTTTA GGCTTCTTTT TTATTAGTTA 360 

ATTTATCAAG TGAGTATATT TGAGTAAAAT ATTCACTGCA TAAAGATTGA AGATAATCCA 420 
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CTGTGGACTC GGACGCTGGA AAGTCAATTT AGCAATCGTC CAACTAOATT GTAGAACTTC 540 

GCCTAATAAT ACACCTAAAA TATATTGATA ACTCATTGTG ACAAGTAGTT GAATTTCTAC 600 

TATATTTTCA TCTTTTAATA TAAAATACAA CATGATAGAA ATTAAAGTTA TAACAACAAT 660 

GGGTGAGCCT TTTCtAGATG TTAAAATTAA AAAATAAATA AATATCAATA AATAGGTAAA 720 

TATAAAGAAA CTAGGTATCT GATAATGGCT CGACGCTAAA CCTATCAATA ACATAATAGG 780 

TGGCATAAAA TAACCACCAA TCGTTGTAAG CCATTGGCCT GCTAGATGTC TAGATTGTGT 84 0 

AATTGCGAAT CCTTGTTGTA ATGTCTGTTG TCGCTCTCGT GGACTTGTTA CAATGACTAA 900 

ATCTTTTGCA CGGCCACCAG CGAGTTTATT AAACAGTACA TGACCAAATT CATGTGTTAA 960 

AACAGGGATA TAGTTTAAAA TGACATCTAA ATAGTTCAAA ACAGGCTTAT GTCTATATTG 1020 

ATGAATAGCA ATATAACAAG CTGCAACAAT AACGATAATG TATATATTAA GTTGAATTGT 1080 

CGTATTAAAA AAGTTTGATA AATAATTCAT TGTTAACCTC ATATAAGATA TTAATTTAAA 1140 

GTTTGCTTAT CACTTATTAT AAATGATATT GGCATCAATA GCGTTAGACT TTAGACTTAC 1200 

CTTAGTTAAA CTAATTTTAA TTTTTGAAAA GGTGAATATG TGTTAAAATA AAGCAAAATC 1260 

25 ATTTCGATAT AAATAGGATG AATATAAATA CTGTTAATAT TGATTACACT AACATAATAA 1320 

TGAAATAAGA TAGGAGATTC CTGTTATGAC TGTTGAAOAA AGATCCAATA CAGC CAAAGT 13 80 

TGACATTTTA GGGGTCGATT TTGATAATAC AACAATGTTG CAAATGGTTG AAAATATTAA 1440 

30 AACCTTTTTT GCAAATCAAT CAACGAATAA TCTTTTTATA GTAACAGCCA ACCCTGAAAT 1500 

AGTGAATTAC GCGACGACAC ATCAAGCGTA TTTAGAGTTA ATAAATCAAG CGAGCTATAT 1560 

TGTTG CTG AT GGGACAGGAG TAGTCAAAGC TTCGCATCGT TTAAAGCAAC CTCTAGCGCA 1620 

TCGTATACCT GGTATTGAGT TGATGGATGA ATGTTTGAAA ATTGCT CATG TAAATCATCA 1680 

AAAAGTATTT TTGCTAGGGG CAACTAATGA AGTTGTAGAA GCGGCACAAT ATGCATTGCA 1740 

ACAAAGATAT CCAAACATAT CGTTTGCACA TCATCACGGT TATATTGATT TAGAAGATGA 1800 

GACAGTAGTG AAcGnAnTTA AACTGTTTAA ACCTGATTAC ATATTTGTAG GTATGGGATT 1860 

CCCTAAACAA GAAGAATGGA TTATGACACA TGAAAACCAA TTTGAATCTA CAGTGATGAT 1920 

GGGCGTAGGT GGTTCTCTTG AAGTATTTGC TGGGGCTAAA AAGAGAGCGC CTTATATCTT 198 0 

TAGAAAATTA AACATTGAAT GGATATATAG AGCATTAATA GATTGGAAAC GTATTGGTAG 2040 

ATTAAAGAGT ATTCCAATAT TTATGTATAA AATAGCCAAA GC aAAAAGAA AAATAAAAAA 2100 

50 GGCGAAATAA TCATGATGAC AAAAATAAAA CCGAGGAAAT CCTTAAATGG AGATTCTCGG 2160 

TTTTTTCGGT TTATTTAATA ACGAAGCGGG ACTCATCGAG TTTGTTTCTA AATTCTTTTT 2220 
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CATCAAGTTC ACC6TAATCT TTTAACTTTC 


CGCCTTCAAT 


CCAAGCAATC 


TTAGTACAAA 


2340 


ATTGTCTCAC 


TTGTCCTAAG 


TTATGACTAA 


CGAAAAAGAT 


GGTTTTGTTT 


TGCTCTTTAA 


2400 


ACTCGTAAAT 


TTTATCTAAA 


CATTTTTGTG 


CAAAAGTTTG 


GTCACCTACA 


GATAAAGCTT 


2460 


CGTCAATGAC 


TAAGATATCT GGATTAACTG 


TGATATTAAT 


TGAAAAACCA 


AOTTTTGCAC 


2520 


GCATACCACT 


TGAATACTTT 


TTAACTGGTT 


GATAAATAAA 


CTCACCAAGT 


TCACTAAATT 


2580 


CAATAATCTT AGGTGTCATC 


GCTTTAATTT 


CTTTTCGCTT 


AAAGCCCATA 


CATAACATTT 


2640 


TAAATTCGAT 


ATTTTCAATC 


CCTGTAAGTT 


GTCCACTCAA 


GCCAGCACTA 


ATTGCGATAA 


2700 


CGCTGACTTC 


ACCATTACGA 


TCCACTTTGC 


CAACAGTAGG 


CGACAAAGAA 


CCGCCAATGA 


2760 


TATTGCTCAA 


CGTTGATTTG 


CCGGAACCAT 


TGATGCCAAC 


AAGCCCTATG 


ACGTCACCTT 


2820 


CATATOCTTT 


TAAACTAATO 


TCATCTAAAG 


GGAAAAATGT 


TTTGTTTTTA 


TGTTTGGGAA 


2880 


TGAGCGCATC 


TTTCATACGT 


TCTTTATTTG 


TACGATAAAT 


ACGATATTCT 


TTTGTTACAT 


2940 


TTTTAATGTT 


TACCGAAACG 


TTCATTTGTA 


GACCTTCCTT 


ATTCACATTT 


ATCTAGATTA 


3000 


TAATATACTA 


CTCAACAGTT 


GTTAAATTTT 


AAAACCTGTT 


GTAAAGTGTA 


TAGAAGATTT 


3060 


TGTTATTATC 


AGAGTGGGTG 


TTTTGACACA AAATGTTAAT 


CATCAATGAT 


AACAATGATA 


3120 


TTTAAAAACT 


AAACTTATTT 


CAACTTACAT 


GATTGTATAC 


TATAATGTAT 


TTGTAATAAA 


3180 


CTAATATTTT 


AAAGAACTAG 


ACAATAATTT 


TGATAGCATC 


CATGTATAGT 


GATAGTATTT 


3240 


ACAACAATTA 


TTATAATACT 


ATTTAGTTAA 


GTAGAGAAAT 


AGTTAAACAT 


TTGAAAGTGT 


3300 


GGTTTAATGG 


AATGTCAGCA 


ATAGGAACAG 


TTTTTAAAGA 


ACATGTAAAG 


AACTTTTATT 


3360 


TAATTCAAAG 


ACTGGCTCAG 


TTTCAAGTTA 


AAATTATCAA 


TCATAGTAAC 


TATTTAGGTG 


3420 


TGGCTTGGGA ATTAATTAAC 


CCTGTTATGC 


AAATTATGGT 


TTACTGGATG 


GTTTTTGGAT 


3480 


TAGCSAATAAG AAGTAATGCA 


CCAATTCATG 


GTGTACCTTT 


TGTTTATTGG 


TTATTGGTTG 


3540 


GTATCAGTAT 


GTGGTTCTTC 


ATCAACCAAG 


GTATTTTAGA 


AGGTACTAAA 


GCAATTACAC 


3600 


AAAAGTTTAA 


TCAAGTATCG 


AAAATGAAcT 


TCCCGTTATC 


GATAtACCGA 


CATATATTGT 


3660 


(2) INFORMATION FOR SEQ ID NO: 173: 









45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13868 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND ED NESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 173: 
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ATTAATCACT TGTTGTGTAG AGTCTTGTCC GTTTTGGTTA TGATTGTTAG CCATGATATA 120 

CCTCCCTTAC AACACTCGTG GACCAGAAGT TTTCTGATCT CTCACATTAA CTTCTAACTT 180 

ACGTACTGGC ATTTCTGTGA AATATTCTAC ATTCTTTTTA ATATCCGAAC GAATTGCTTC 240 

AGTTAAAGAT TGAACTTGAA CATTATTTGG TACGAAAAAG TCAGTTTTAA TGTCGATATA 300 

AGATTTATTT TTTTTGTTAT ATAGTTTCGC AACTACATTT GGTTGTCTTA CTTGATCATA 360 

TTTTGCAACC GTATCGAATG CCGTCTTTTC AACAGCTTTA CGAGATACGT AAACATGACC 420 

AT CATCGAAG TCTTTGTATA ATCCAGGTTT TCGATGCGTA GGTTTGAAGA TACTAAATAC 480 

TAATATAAGA CCTATTAATA TCAATAGTGC AGCAAGTGAA ATAAGTAATG GTTGGAACCA 540 

TTCAAATTGA AGGAAGTAGT CTTGATATTC AGTTATACGT CCATCTTGGA TATACATGAA €00 

TAACAGGAAC CCCACGaTTA CTACTATTAA TAAGCCAAGG ATAAAGTTTT TAAGTCGTTT €60 

CACCCCTAAC GACACCTCCT TAGTTAAAGT TAATTTAAAA ACATATTAAA TATGTACCCA 720 

TCAGTTTTTT TCTTAAACAT AATAAATTAA TAACTTTAAA TTTATTTTTA ATATATAAGA 780 

TGAAGTACCA TTTAGTAATA TATTCCCTAG TTTTTGTAAA TAAAACCTCA TTATTAATTA 840 

ATTyTCGTCA ATATGTTTTG AAGAACGATA TTCTAAAATA TCTGGGTCAC GATGTTTAAT 900 

TAAAACCTTA TTACTATTTC TCGGTTTCTC CTCACTCAAA GATTTTATAA GCGACCATAT 960 

CATCGCTATA ATGACCACGG AAAATGGTAA CGCAGCAATG ATTAATAAAT TTTGAATTGC 1020 

TTGAGTACCA CCTGTGTAAA TCATGATGAT TGCAAATAAT GCCATAATGA TACCCCAACT 1080 

CACTTTGACA AATGACTTCG GATTAATATC ACCACTTGAA CTCAACATAC CTAAAACATA 1140 

AGTTGC OGAA TCCGCTGATG TAACAAAGAA AATCATAATA ACAAGTAAAG TAATTAAGCT 1200 

TAATAGAAAA CCTAGCGGAT AATGTTGTAG CGTCGCAAAA GTTGCTGTTT CTGTCGCAGC 1260 

TTTASCAATA TCGGCAATAT GATTATCTTG TAAGTAAATT GCTGACG CGC CGAATACCGC 1320 

AAAGAATATA AAGCAAACTA ACGCCGGGAC AAAAAGTACA CCTAGAATAA ATTCTTTAAT 1380 

CGTACGTCCT TTTGACACAC GTGCAATAAA TATACCTACA AATGGTGCCC AAGATATCCA 144 0 

CCATGCCCAG TAAAAGATTG TCCAATTTTG TAACCATTGG AATTTTTGAC CACCTGTCGG 1500 

AATGCGTAAA CTCATACTAA AGAAATTTGC AATATAATTA CCTAGACCAT TCGTAAATGT 1560 

ATTTAAAATG TATAGCGTTG GCCCAACAAT AAAAAGACCA ATAAGTACTA CAAAAGCAAG 1620 

TAACATGTTG AT ATT ACT CA ACGTTTTGAT ACCTTTATCG ATACCTGACC ATGCTGACCA 1680 

AGTAAATAAT ATGGTTGCAA TGACAATCAA GATTACTTGC ATCGTGAAGT TACTCGGTAC 1740 

ATTAAATAAA AAATGTAAAC CTTCGTTTAT TTGCAATGCA CCGAAACCTA ATGTTGCAGC 1800 
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CATTGCCTTT TCACCTAATA AAGGCGTCAA TGTAGCGCTG ACTAAGCCAG GATATCCTTT 


U 




ATGAAAGCTA 


AAATATGCAA 


ACACTAGCGC 


GACAATACCA 


TAGACTGCCC 


ATGCATGAAT 


loan 


s 


CCCCCAATGG AAAAATGAAA ACTGCATTGC ATCATTAATT 


GCAGATTGCG 


TGCCAGCTTT 






ATGAATAGGC 


GTTAATTTGA 


AGGCATGACT 


GATTGGTTCT 


GCCGTTGTCC 


AGAACACAAG 




10 


TCCTATTCCC 


ATACCAGCAC 


TAAATAACAT 


AGCAAACCAA 


GACGGCAATG 


AGAATTCAGG 




ATCTTCGCCT 


TCTTCACCTA 


ATGTAATGTT 


TGCGTATCTC 


GAAAATAAAA 


TATACACACA 


2220 




GACAAATAAA ATAACTAAAA 


CGAGCAATAA 


ATAATACCAA 


GaAAAATGTA 


GCGCAATAAA 


2280 


IS 


x \jr X AVi 1AA 1 \3 


TTTTGCGTGA 


GTTTTTCTAA 


CTGTTTCGGA AATATTGCTC 


CAAAAGCAAC 


2340 




AAA iAlAJvi TA 


UAT AT CA CTA 


AAGATACCCA 


AAACACTAGA 


CTTACTGATT 


TATTTTTCAT 


2400 




AAATAuAAAC 


CCTTTCTGTG 


TAATGGTAAG 


TTCATACCCA 


TAACTGCAAC 


ATTTTAATCA 


2460 


20 


TTTGTAATTT 


TATATAGACA 


CAATTAATAA 


TGCCTCATCT 


TTTAAAAATG 


ATATATAAAA 


2520 




CACACTCAAA 


TTATTTATCA 


TTGAGCIAAC^A 

X X VJ/WJVJl/lw^ 


AAGTATTTTA 


TTGTATTTAA 


^i'l'AATY^f^t u i"i' 

x rin x wwv#> x x 


2580 




'TV**'! 'TW^'IV^IS *T> 


TATTGATTTG 


ATACCTGCAA 


AGTTGCCATA 


TTTCCGTTTA 


GAATCAATAG 


2640 


25 


XA^V^L. InuAUi 


(•AAAAAATAA 


GTCGCfTTATA 


CAGTATTTTC 


TGCATAAGGC 


GAfTTTArTT 

XJ-J^^— XXX X X 


2700 




*\\- X rtrti\. Inl 


nlnl livil 1 A 


v«xnnx X X X 


AAlvJAi iuAl 


TGTXTTTCCA 


ACAATTGATG 


2760 




XV3Vf X XWnXnX 


.rxrVVj X X X A V^u 


GTGATAAACC 


«TTP Zl A & & n fT 
X X UAA/Ul/iL 1 


x \j l\a Ivvi 1 X\j 


TTGGTTGGTA 

X X WW X A\7VJ X 


2820 


30 


ATGCC CTGAT 


•T , I"**T , JV'T , A'T , *T**T'*F 

XVvX^^X^^X XXX 


TCGTAATATC 


TTCTAAATAC 


TCATGTTGTT 


TAATCATATC 


2880 




AGGCGTTCGA 


TGAATTGGAC 


GCGCAAACAT 


AAATTCATGT 


GTAAATGTTA 


TACTTTTTAA 


2940 


35 


TTTTAATGCA 


TTTaAATCTT 


GATCTTCATT 


AAAAGCTACG 


ATAGTCGTAA 


TATGCCCTAA 


3000 


TGGTTTTATC 


AGTTCAATCA 


TAGTATTGTA 


ATACAAGTCT 


GTATTATAGG 


TGCAAAATAT 


- 3060 




ATAATCTACT 


AATGGAATTT 


CTTTAAATTG 


ACGCACTAAA 


TCCTCTTTAT 


GATTCAATAC 


3120 


40 


GATATCTGCG 


CCCATCTTTT 


CACACCACTC 


TGTTGTTTCT 


TGTCGTGATG 


CTGTTGTAAT 


3180 


GACAGTTAAA 


CCATACCGTT 


TAGCAATTTG 


AGTGGCTATA 


CTGCCTACAC 


CACCGGCACC 


3240 




ATTAATGATT 


AAGACAGACT 


TCCCTTCGTT 


TTCAGCAGGA 


TTCGTAGAAA 


TTTTAAATGT 


3300 


45 


ATCAAAAAAC 


GTTTCATATG 


CCGTAATACC 


AGTTAGCGGT 


AGACTAACCG 


CTTCATTAGC 


3360 




ACTTATGTTG 


TGTGGTGCTT 


TTG CAACT AT 


AGCTTCTGAC 


ACCAATTGAT 


ATGTCGCATT 


3420 




TGATCCTTGT 


CTATTTGGCG 


ATCCAGCATA 


AAATACAACG 


TCACCCGGAC 


TAAATAATGT 


3480 


SO 


AACGTCTGGT 


CCGATAGCTT 


CAACAGTACC 


AATAGCATCA 


AACCCAAGTA 


CACGAGGTGC 


3540 




TTGAGTGACT 


TCCATTTGTC 


GTTGCTTTGT 


ATCTACAGGA 


TTTACACTAA 


TGCTATTTAC 


3600 
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ATTTCCTTCT TCCAATTTAA AGGGCTTCTC AAATCCTATC ATTTTCATAT CGTTTCACCT 3720 

CATTTATGAA CTTATTTCTT ATTATACAAA ATAGAAGCCA TGTGTGCTTA TATCGCAGCA 3780 

5 TCATGACTCC TTTTTCATTT GAATATATAA ATAATTACAG ACGACTTTCG TATTAAATTT 3840 

TAGACTTATT TCTACCATGT TGCTGAACAA ATTTACTTTA GATAAAAAAT TATTAAATTT 3900 

TGGTCAATTA ACAAAGTTAG TTTGTTAAAA CGTgATACTT TATTATTCCG TTACTTTAAT 3960 

10 

AACTTGTTTA CCAAAGTTAT CGCCAGTaAA TAAATTTTTA AATGCATGTG GCGCATTTTC 4020 

AAAACCATCT TCAATGGTTA CTTGTGACTG AATTTTACCT TCTTGAACCC ATGTTGCAAG 4080 

CTGTTCACTA GCTTCTTTAA AAGCATTAGC GAATTCACTT ACCAAGAAGC CTCTCATCAT 4140 

15 

TACTTGCTTC TTAATAAGCG TACCTTGAAT ACGTCGTCCG ATATCGGCTT CAGGATGATT 4200 

ATATGACGAA ATTGCGCCAC ATACTGGTAC ACGTGCAAAA CGATTTAAAT GCTTAAATAC 4260 

2o TTCATCGCCA ACTGTTCCAC CAACATTTTC AAAATAAACA TCAATACCAT CTGGTACTGC 4320 

TTGTGCTAAC GCTTCTGCAA AATCCTCTTT CTTATAATCA ATACCAGCGT CAAAGCCCAG 4380 

TGTCTCTGTT AAATAATTTA CTTTTTTGTC GCCACCCGCA AT AC CT ACT A CACGGCAACC 444 0 

2s TTTAATCTTA GCAATTTGAC CTACAACTGA ACCTACAGCA CCAGATGCAG CTGAAACCAC 4 500 

AACAGTATCA CCGGCTTTAG GTTGTCCAAT ATCAAGCAGA CCATGATATG CTGTTTGTCC 4 560 

TGGCATTCCT AAAACACTTA AATATAAATC AAGTGGTACA TCTGTCGTTG GAACTTTAGT 4 62 0 

AATTTGATCC GCTTGGACAT GATTAATGAT TCGCCAAGGC AACATACCTA CAACGACATC 4 68 0 

TCCTTTTTTA TAATCTGCGA GTGTCGAATC AATTACTTTT GCAACGACAT GGCTAACAAT 474 0 

CGGTTTACCA ATTTCAAAAG GCTGTACATA CGAATCTGCC TTAGTCATAC GTCCTCTCAT 4 900 

35 

ATATGGATCC ACTGAAATAT ACAGCGTTTG TACAAGTACA CCATCGCTCT CAAGTTTaGG 4 860 

CGTGTCAATC TCTTCaATTT TGAATGTATC CTCTTGAGGC ATGCCkTCTG GTATTTTGTT 4 92 0 

AAAAAGAATT TGTTTATTTT GCATCATTAA TCACCTTT CT TTATTTGAAA CTTTTACTTA 4 980 

40 

TTTGTTACTT AAGCGTTAAG TTTGAATTGT GTCtTCGTGA TGTCTGTATG CAAATACATT 504 0 

CTTAGTTGTT ATATTTTGAC TTAAGCACTG ATTCATTCAT GTAACTTCAA CCACATTATA 5100 

45 TTTGCTATAA TCATAAATTT AAAATGTTAC GACTTAGACA TTTTATGGAA ACTCTCAAAC 5160 

AATAGATAAT TTTTGAAAAG CTCTAATATT ACAAGCTTTT TTGCCCCAGA AAAACTAGCA 5220 

GTTGCTTTAT TTTTTCCATA AGAAGTCGAT TAACTCATTA GCAACATTTT CATTCTCATG 52 80 

50 AAGCTGACTA TGTTGTGCAG GCTCACCTTC ATATTTAGAT TCTCGATAAC TTTTCGGACT 534 0 

ATTTCCCAGT AAATATTTTA ATGATTTCGA AGAACTATTA GACACTCTGC CGTCTGAATG 54 00 
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ATCTTTTAGC ACGCGTAATT GCTGATAAGG TTGATTCATT CGACTTGGTT TACCATCTTT 5520 

ATCAACTGTA ATTTCATTGA CATCTTCATT CATATTTAAA ACACCATTAA ATGTCCCTGC 5580 

AATATTCACT TGTTTGTTTA ACTGTGGCAG TGACTTGTCG TTACCATATG TCATCATATA 5640 

TTCTGCAAAT GTTAAGTTCC CCATTGAC5TG ACCOACAAAG TTGAATTTAT CGAAATTGTA 5700 

TTCAGATTGT AACTTAGTCA GTACATTTTT AAACCACGCA GCATTCTTAT CCAAATAGCC 5760 

TTGTCTGTTA TTTTCAAGTT CAATTTTCAC AATAGGATTC ACTGCATCTT TTCTTAGTTT 5820 

CCCTTTAAAT GTCACTGCAC CATCCTTTGA AACGTAAGCA GTGATGATAT CTTTAGTTAC 5880 

CCCTCTTTTT TCTGCTTGCT TCACCATAAA CTTTTCAGAA TTGGCACTAC CACCAAATCC 5940 

ATGTAAGAAC AATGTTGGAA TTGGCTTTTT AACAAATTGC TGTTGTTGTA TTTTAAATGT 6000 

TTGTGCCTGT CGTTGACTAA ACACCACCAT AATAATAGAG CCTATAATAA TAGCGACCGC 6060 

TAACAATGTC GTAATAATTA CAAAAATTTT CTTCACACTT TTAACTCCCA TTCATGTCTT 6120 

TTATATAAGT ATAAAGGATG TGATTAAAAA TGTCCTTTAG TTGATTTTGA ATACATCATT 6180 

AACTTTTAAG ATGACTTTGG AAAGTTGTCC GTTAACGTTT GTTAATTGAT TGCTTCTTTA 6240 

GCTTTCAATG GTGTGTCACC CATTGATTAA TATATAAATA TGTATATGCA TGTTTAATTT 6300 

ATCTCTTTCT ATAAATAAAG ACCTACCAGC ACTCGACTGA TAGGCCTTTT AAT AT CT ATA 6360 

ATTATTTAAT TTCTTTTGTT TCGGCTAACT CTTTGTACCA . ATAAGCACTT TTCTTAGGAT 6420 

AACGTTCTTG AGTCTCAAAA TCGACATAGA ATAAACCATA TCGTTTTTCA TAACCATTTG 64 80 

ACCAAGAGAA CACATCCATT AATGACCAAA TAAAGTAACC TTTAACATTT GCACCATCTA 654 0 

TAATAGCATC TGCAATAACG TTCAAATGTT GTCTTACATA, ATCAATACGT GCATCATCAT 6600 

GAACTGTTTT TTCAGATTCA ATAAATTCAT CTTTATATCC TAAACCATTT TCAGTGATAT 6660 

AAAXCTTATG aTAGTTAGGA TAATCTTTAA CAACACGCAT GaTTTGATCA TATAAACCTT 6720 

GAGGATAGAT CATCCAGTCC CAGTCTGTGC GAGGTACGTC GACATCAAAT TCACGTTGTC 6780 

CGACACCTTT AAGTTGGTAT TTAGAACCGC CTTTATCACC TGTCGCATTA TGCGTGATTT 684 0 

CAGATTCTCC ATCGTAACCT CTCATCCAAT CACTCATGTA GTAATTGATA CCTAAGAAGT 6900 

CGTTTAAATC TTTGGCTGCA TCTAAAATGG CATAATCTTC ATCTGTAATG TTTAATTTAC 6960 

CGCCATTAAC AGATAAGATA TGTTGCACAC CTTCCATCGT TTCACGAGAA TACTTACCTA 7020 

AATATGTTGC ATCTAAGATG AATTTATTAT GGATGATATC TTCTAATTCT GCTGCACGAA 7080 

CATCTTCAGG ATTTGATGGA TCGAACGGAT ATTTTGTTGG CAATGCGTGT ACAACACCAA 7140 

TTTCTCCTTT GTATCCGCCA TCTTTAAATA ATTTTACTGC TCTAGCATGA GCCACCATCA 7200 
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CTACTAAATA TTGACCATCA CCAATAGGTC CAATTTCATT GAATGTAGTC CAATATTTTA 73 20 

CTTCTGGGAA TTCTTTAAAA CAATATTCAG CATAATCTAC AAAGTAOTCA ATCGTTTTAC 7380 

GATTTAGAAA ATCGCCATCT TTGTGTAaCA CTTCTGGTGT ATCAAAATGA TGCAATGTTA 7440 

CAAATGGTTC AACATGACGT TTATGACACT CTGCAAATAA CTTATGGTAA TACTCAACAC 7500 

CTTTAGGGTT AACTTCG CCA TATCCATTTG GGAAGATACG AGACCATGCA ATTGAAATTC 7560 

GGATACCATT AACACCGAAT TTTTCACTTA ATTCTAAATC CACTGGATAT CTGTTATAAA 7620 

AATCACTCGC TGGTTCTGCA GTGTACCAAT AGTTTTCTTC TAAATACGTA TCCCATGCTA 7680 

CGCGACCTTT ACCATCCGTA TTTGTCGCAC CTTCTGCTTG ATATGCTGCT GTTGCTCCAC 7740 

CAAAAATAAA ATCTTCAGGT AATGTTTTAG TCATATOAAA AACTCCTATT CTTAATTTTC 7800 

AAATTGTTGT TGAACGAAAT CAAGGGCTGC TTGGCCATCT CGTGTCAATT TGATATATTC 7860 

AGCACCTTGA GTCTTCGCTA ATTTAATACC TAATCTATCT GTATCTTGCT TAATATCTTC 7920 

ATAGTTAGAC GCAACTTGTG GCGCTAAAAT GATTAATTGG TACTCTTTCA TAATGTCCAT 7980 

ATGTGCGCCA TATCCGCCAG CTGCCGCTTT CACTGGCACA TGATATTCTT CAGCTGCTTT 8040 

ATTAAGTGCA TTGGCTAATA ATCCACTTGT ACCACCACCG GCACAAAGTA CTAAGACATT 8100 

TGTTTGTTCT GTGATATTTG AAGCTTTAGC TGCATCGTCT GATACACCAC TTGCCGCTAA 8160 

AATTGAATCA GCTTTTTTCG TATCAAAGTT TGCTGCAACT TTTTCTTTTA AATCTGAATT 8220 

ACTTTCTTTA CGTC CTTCTT CTT CAT CAAG AATTTCACTA TCATAAACTT TTAGGAATGG 8280 

GTAGTAAATA ATAATATCTA CAACAATCAA AGTAATAGCT AGTACGAATG ACCATAAACC 834 0 

AAAACCTGTA CCCATGATAA TGCCCAATGG ACCTGGTGTT GTCCAAGGTA AATTCACACT 84 00 

AAAACTATTC ATTCCTAACA CTTCAACGAA AAGTTTGAAA ATCCATACGT TAACAATTGG 84 60 

TGCTAATACA AATGGAATAA AGAACACAGG ATTCAATACT AGTGGTGCAC CAAATAAAAT 8520 

TGGTTCGTTT ACACCAAAGA ATGTTGGTAC AACTGATGCA CGTCCAATCG CTTTGTTTCG 8580 

TTTAGATTTC GTCATCCACA TAAACATOAA CGGGACGACC AATGTTGCAC CCGTACCTCC 8640 

AAATGTAACG ATAAACATTT GTGTACCTGA TGTAATAATT TTATCTGCGT GTTCTCCAGC 8700 

TTGAAGCAAC TTGAAGTTCG CTTCGATATT CG CAT ATGT A ATGGCTGCAA TTGCTGGCTC 8760 

TACAATTGAC GGACCATGAA TACCTACAAA CCAGAATAAT GCAAAGGCAC CAAAGATAAT 8820 

TGTGACACCA ATCCATCCAT CTGCTGCTGT AAATAATGGT TCGAATAATT TTAAAATACC 8880 

TTCCGCTACA TTTGATTTAA AGCTGTTGCG AATGACTAAA TCTAATGCAT AAAGAATGAT 8 940 

GATTACCGCT GAAAATGGAA TTAAGTCCTT AAATACTTGT GAAATATTCG GCGGTACTTC 9000 
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AAATGCTGAT AAGAATGCTG 


TTAATAAACC 


TTTAGTVf^C 

•a a inu a a www 


ATAAATGCAC 


TTAAGAATCC 






ACCATCTTTG 


GCTGGATCAG 


AAGCTAAGAA 


CAAGAATCCA 


CACATCGCTG 


CPAGCATTGT 

Xht A n\J\^l A A Xj A 


71DV 


5 


AGAAATAAAG 


TTAATTTGAT 


TTGTACTTTC 


TAGCTTACGG 


TTAAATGAAT 


fTGTTAAAnA 






TTTCGCTGTC 


GTTCCTGCTA 


CTAAAAATGC 


TACAAGCCCC 


ATCGTATAGT 


TATATYSfSm* 


3JUU 




CATTAAAATG 


GCTTCCATGC 


CTTTATCCCA 


TTTAAAACCA 


AATATATTTG 

AAX#%XnX X X\J 


GCACATATGP 
\jv— <nwn x x vjw 


7JwU 


10 


AATTAATAGA 


AAGATACTTG 


AGAATAAGAT 

AUnn X Anun X 


VanwnOUwnX X 


firanaaaTaa 

ULnunnAlAn 


A TPP ATT* AfV2 


Oil O A 




GATGGCTCTT 


AAATATATGT 


T A fYlTYS A *P A A 
X av.u 1 van X AA 


^P^P^P^*^P^^^^ AAA 
UxAAn 




Li. 1 11 1UAA1 


94 80 


IS 


TTGTGCGATC 


AATTTTTGCA 




wACCCTCTTT 


TiTaaaaTTr 

X Al AAAAX 1\. 


1AA1 AAA 1\iL 


9540 


TTCATTAAAT 


CTTTCAGTAA 


AATTGTTGTC 


Al XAAAxXiAX 




CATCATCGli 


9600 




ACACTGTATG 


CAATATCATC 


ACCTTGCGCT 


TCTTTAGCCA 


1\jT 


TTGTGCTCTA 


9660 


20 


TGCGCTTCCG 


CAATGCAATT 


GTTTCCTTCT 


TCAATCAGTG 


' CATCTGCTTT 


TGCAAAATCT 


9720 




CCAGCTTGAG 


CTGCTGTTAA 


TGCTTCTAAA 


AACTTAGAAC 


/WW *^1k rTl^l^^^^^"* 

GTGCATCCCC 


TGCAAATGCA 


9780 




ACAATTTCAA 


AACCTAATAA 


TTGGACTTCT 


TCTCTATTCA 


TAGCATTAAT 


CCCCTTTTAA 


9840 


25 


ACTTATTTTC 


TTTGTTTCCA 


AGATGTCGCA 


GTATCTTTTA 


ATACTTTATT 


TAAGTCATCA 


9900 




ATATTTTTGA 


AACCAGTTGT 


ACGTAACCAT 


TCACGAGCAG 


wATCTTCACC 


TTGTTCAATG 


9960 




TATACTTGAA 


CAGCACCAGA 


CCATGTAGCA 


CGGCCACAAA 


GTACCCCGTT 


GAATTTAGCA 


10020 


30 


CCAGCTTCGT 


GAGCAAATTT 


TAAAGTTTCT 


TGGAATAATT 


CCGCAGAAAC 


ACCAGCACTT 


10080 




AAGTAAATGT 


ATGGTAAATG 


AGTTGCTGCA 


TCTTGATCTT 


TAAAGTGTTG 


TGCCX5CTTCC 


10140 




TCTTTTGTAT 


AAACCACTTC 


ACCTTCaGCA 


AAGCCTT CTA 


CAT ATTT CAT 


GTTTACTGGT 


10200 


35 


ACTTCAACTT 


TCAATACATC 


IV »(vnwn» ft ftp 


CGTGGTTCTG 


AGAATAATTT 


CATTGCTTCG 


10260 




TTAACCTTTC 


TAGGCTTAAC 




X CnAUiC X AL 


/ V i'l *I* A ^T*rf™"* A^5^? 


M1\j 1 x\J 1 vJA 


10320 


40 


TCG1*ATGTTA atacttctaa 




A ^T* hTf "i w i , r ""IVi 
J\ X f\ X l_ X XLX\9 


paapApaTTP 

UnnunU/vl X w 


*iY2a apmaTT 
X\jAAL.LAaAl 1 




CTTTCAATGT 


ATGCTTTCTT 


TTfSAATYJTTA 

X 1 Wrtrt I. \-J .1 1A 


"i ~ b *f^A^7 
X X X w X X Lrlv? 


raTraTraRp 
v-*-t x v_/-v x y~-t\t\\-> 


UTraTarTa a 

nX LnlAw lAn 


i a ^ n 
1U44U 




AGTAAGAATT 


TAACAGCATT 




T*ff — I*A A A 
XLJ XXX /UwiU 


V X X X lULnwi 


^^^^ A A 1 * 
LUAL1L1AL1 


lUbUU 


4S 


AAACAGTCAG 


GTAAACGACC 


TTTAGCGTTT 


ACGTCATATC 


CAGTTTTTTC 


ATAAGCAAGT 


10560 




AATAATCCAC 


AATCTTTGTT 


ACGTGCATCT 


GAAGCTGGTA 


AAC CAT ATT C 


AGGATCTAAT 


10620 




AAAATTGAAG 


ATGCATATTG 


TGTTAATTCT 


TCCGCAACTA 


ATACTTTTAA 


TTGTTCAATT 


10680 


60 


TGAGCTACAG 


TTGGTTCTTC 


AGTTTGATGT 


TTTGCCATCA 


TGCGTTTTAA 


AG CACCACGT 


10740 




TGGTCAAATG 


CTAATGCAGA 


AATGATACCT 


TCGTTGTTAC 


TTAATTGTTC 


AATTGATGCG 


10800 
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TCATCATAAT 


TATTTAAATT 


' GACATAACCT 


' GTTTGTGCTT 


CTTGTGCATT 


' CAGCATGCCT 


10920 




AAAGTATTGG 


armrfAG 


TAAATCGTGG 


TCGTTTTCAT 


GATTAAGAAT 


TGCTGAAGTA 


10980 


5 


ATTCCAGCAA 


CTGTAGAATC 


ACCTGAACCA 


ACCGGATTTA 


ATACACTTAT 


TGTCGGAATA 


11040 




TTCACTCTAT 


AGAATGTATG 


ATTGTGCTTA 


GCGAATGCAC 


CTTGTGCACC 


TAAAGACACA 


11100 


10 


ATAATCCACT 


CAATCCCTTC 


GAATAAGGGT 


TGTGACACTG 


CCTGTTTCAA 


ACTTTCTAAA 


11160 


CTTTCATCAA 


GTGGCTGGTT 


AAGCAATTGA 


TATAGTTCAG 


AAATGTTTGG 


TTTAATGACT 


11220 




GTAGGTTTGT 


ATGGATTTTC 


CAAAACTGTT 


TGCAAAGTtG 


CACCCGAGCA ATCTAATATC 


11280 


15 


ACAGGCACAC 


CTTTGTTTTG 


GCATCGTTCA 


ATGATTTGTG 


CATAATAATC 


TTGATTTAAT 


11340 




CCTTTAGGTA 


AGCTACCTGA AATAGCAACT 


GCTTCAACTT 


TTTCTAATAA 


TTGTTCAAAA 


11400 




TGTTTAATAA 


ATCCTGCAGC 


CTCTTGATTA 


TCAATCTCCG 


GTCCCTGCTC 


TAAAATTTCT 


11460 


20 


GTTTGTTGCC 


CTTCATGTAA 


AATTGCAATG 


CAGTTTCGTG 


TTTCACCCTT 


AATGTTATAA 


11520 




AATGCATGCT 


TGATGTCGGC 


ATGATCTAAT 


TTTTTAGCAA 


TAAATTGACC 


TAATTCACCG 


11580 




CCAATAAAAC 


CACTCGCAAG 


GACTGGCTCA 


CCTACTTGCG 


CAAGTACTCT 


TGTTACATTT 


11640 


25 


AAACCTTTAC 


CACCAG CTGT 


TTTACTTACT 


TCTTGAACAC 


GATTAACATC 


ATCTAATTTC 


11700 




AATGCTGTTA 


ATGGGTATGA 


AATATCAACG 


GATGGATTTA 


ATGTTAAAGT 


TAAAATCATA 


11760 




TGTGTCGTCC 


CTTAATCGTG 


GTATTCGCCT 


CTGTCCCATT 


TTTCTAAGAA 


TTCATCAAAG 


11820 


30 


AAATGTGGAT 


CAGCTTGATC 


TGCATTGCTT 


GTTTCTAAAT 


GTTTAATTTT 


AGCGATTAAT 


11880 




TTTTTGTTCT 


CTTCAGTTGG 


TTTATATTCA 


GCATTAATAA 


ATGCATCGAT 


AATATCGCAC 


11940 


35 


ATTAATAACT 


CACCTATAAT 


ACGTCCACCG 


AAGCCAATAA 


CGTTCGCATT 


TAATTCTTCT 


12000 


TTAGCGTATA ACGCTGATGT 


CATATCACGT 


ACTAGTGCTG 


AACGAACGCC 


AGGTACTTTA 


12060 




TTTACAGCAT 


TGTTAATACC 


AACACCTGTT 


CCACAAATAC 


AAACACCTAA 


GTCTG CATTA 


12120 


40 


CCGCTAACAA 


CTTGTTCGCC 


AACTTTTTTA 


CCAAAAATTG 


GATAATGTGT 


TCTTGTGAAA 


12180 




TCGTATGTTC 


CTACGTCAAT 


GACTTCATGT 


CCTTTTGATT 


TTAAAAATTC 


AGATACACGC 


12240 




ATTTTTGTAT 


CTGTAACAAT 


ATGGTCGCAT 


CCTAATGCAA 


TCTTCATAGT 


AATTTTTCCT 


12300 


45 


CCTTAGCACA 


TTTTATTAAG 


CATATCTACG 


CGGATTTGGT 


GTCTACCACC 


ATCGTATTTA 


12360 




CCTTCAACAA 


AACCTTTAAC 


GACATTTTTC 


GCTAATGTGT 


CTCCAACAAT 


TTCAGATCCC 


12420 




ATAGTGATCA 


TTCTTGAATT 


GTTATGGCCT 


CTAGTCATAT 


ATCCAGAGCG 


TTCATCTGAT 


12480 


50 


ACTTCAGCAG 


CAATCATGCC 


TTTGATTTTT 


GTAGCAACCA 


TAAAGCTACC 


TGCACCAAAT 


12540 




GCATCGATAA 


CAATACCTAA 


GTTACCTTCT 


TGACTTTGAA 


CATCTTTTGC 


TACAGCCAAA 


12600 
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10 



1S 



20 



25 



30 



35 



40 



45 



TCTAATAAGT ATGATTTGAT GACTTCTTTT AATCGTTTGC 
ATAATCGCCA TAATAAGACT CCTTTTTACT TTAATTTTGA 
ACATATTTAT TTGTAGGTTA TGAAAATCTT GAGAAAAGGC 
AATTATAAAC ATAAACAAAC AATAAATCAA CATAATATGT 
ACGTATTTTC AAACAATAAG TGAACATTCA TATTGTGGTG 
TCTGAAATTG TAGTAAAACT TTGTCGAGOT TCCCGTTGaC 
GCCCATAAAT GAATGCAAAT TCACATTCAC TTATGAGCAT 
TGCAGTTATA CTTTTAATTT AGTCGACTAC TTCAATATAT 
TTCTTCATCT TCATAGTCCA TGACCACTGC AGT CAATTCG 
AAAATCTTCT TTGCCAACTT TCGTATOATC GATTAACAAG 
TAGTGCCAGT TGTTGCGTAT AGGCTTCATC TAATGTAGAT 
TACTGCGTTA CTACTAAAGA ACATCTTGCT AAATCTTAGT 
CATTTCACCT ACAAATGCTT CTGTAATATG GCGCATTTCA 
AAAATGTGCT GTTTGTTTTT CTAACAAAAT TTTATACACC 
TGTGAGCGTA TGATGATTGA CTTCTTCTGC TAATAGTTCC 
AAACAAAGTA TCCCCATCTT CAATTAATGA TGCAGCTTTT 
TGCAATTTGA CGGGTATGTT TTTCTTTATG CGATATTTCT 

actgcgtgca ccaccatgaa tcttcgttaa aatcccttta 
tcttcgaact gtcatatcag acacatttaa accttcgacg 
gcccttttta ttcactagtt tagcaatttc gtccaaacgt 
attgCCtc 

(2) information for seq id no: 174: 
(i) sequence characteristics : 

(A) LENGTH: 454 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



CAGCTTCATC TGAACCAATA 12720 

AATACCTTTC TTAAAATGTG 12780 

TTTCAATTTG ATTACGTTTA 12840 

TTATAATATG TTTGTTTATG 12900 

TTGTTTTAAT TAGGTATTCG 12960 

ATAAATTTGC ATAAAAAAtA 13020 

ATAGATACAT ATTTTAACAA 13080 

GTTTTAATCG TTTCTACTTT 13140 

TTTAACTGAC AAAATGATGT 13200 

TATTTTTCAA TTGAATTACT 13260 

GTCATCACAG CACCTTTATT 13320 

TTTTCCAACA TGGCGTTCGC 13380 

CCACCAATTA AATAGACACG 13440 

GGCAAACAAT TCGTAATAAT 13500 

ACTGTTGTTC CTGGTCCGAA 13560 

TTAGCTATAA ATCGTTTTTC 13620 

TTATACTGAA ATGTTGAATT 13680 

TTTTCCAATT CAATTAAATC 13740 

ATTTCATTCG TTCTTATCGT 13 800 

TCATGTTTAT TCAATGTAAA 1386 0 

13866 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 174: 
60 TTAAGTCAAC TTTGTCTATA CGGTTTGGAT CtTCTaCCCA ATGTCTTATA AAAGACAATC 60 
CCGCACCTGA AACATAACTC ATGAAATAAG AAAATGGTAT ACCATTAATT TGATCATTTT 12 0 
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AATCTTTACC 


CATACGAAAC 


ATCAATTGAT AAAATGCGAT 


GTCTTTTTCT 


ATCATTTCTA 


240 




TTAAAACGGT 


CATAATTTGA 


TO T ATGTTAT 


CCGTGGUVTAA 


CTTAACTGCT 


CCATTTAACT 


300 


5 


TCTCATCATG AATGAAGTCT 


LTl'ATTTnrT 




GTCCTCTAAT 


TTTTCAAGCA 


360 




#vfc X \*J\ X J\\* X 1 


AlUilAAiAA 


'IV J ^"Y'l'P 24*1*1* 2\ 2V 
1 U^vJ X X /ww\ 


ATWT24 f"F 21 f<Z 


GTTAACATCA 


GCTAAATCTG 


420 


10 


CAATTTGTTG 


CA CAGTAATC 


XlrX lUlAni X 


w X vj X lun l\i 


TAAAAGTTCA AT AAATG CAT 


480 


TTCTCATTG C 


AACTTGTGAT 


TTTCTAATAC 


GTCGATCTAT 


AGTCATTTAT 


ATCAAGTCCT 


540 




CCCCAATGAT 


TATAAACGTT 


ATGTTCATTA 


TCCCACAAAT 


CTCCAACATT 


GATGATTGGC 


600 


15 


ACACAATGTT 


TACCTGTTTA 


ATATAGGTGA 


TAGAAAGAAA 


CAGAAAAAGG 


TGATAACAAT 


660 




GAACCAACAT 


TTACTAGGAA 


ATCCAAAATT 


AACTGTAACT 


CATGTCAATG 


AAGTTAAAGC 


720 




CGGTATTAAC 


CACATCGTTG 


TCGACAGTGT 


TCAATATGGA 


AATCAAGAAA 


TGATTATGGA 


780 


20 


AAAAGATGTC 


ACTGTGGAAA 


TGCGCGATGG 


CGAAAAATTA 


TATATTAATA 


TTTTCAGACC 


640 




AAATAAAGAT 


GGCAAATTCC 


CTGTAGTTAT 


GTCTGCAGAT 


ACTTACGGTA 


AAGATAATAA 


900 




GCCTAAAATC 


ACAAATATGG 


GTGCCCTTTG 


GCCAACATTA 


GGTACCATTC 


CGACATCTAG 


960 


25 


TTTTACACCT 


GAAGAATCAC 


CAGACCCAGG 


AT/TTTGGGTG 


CCAAATGATT 


ATGTTGTAGT 


1020 




TAAAGTTGCA 


TTACGCGGTA 


GTGACAAATC 


CAAAGGCGTC 


TT AT CT C CAT 


GGTCAAAAAG 


1080 


30 


AGAAGCGGAA 


GATTATTACG 


ArTGATTGAA 


TGGGCAGCAA 


ATCAGTCATG 


GAGTAATGGA 


1140 


AATATCGGGA 


CAAATGGTGT 


TTCTTATCTT 


GCGGTGACTC 


AATGGTGGGT 


CGCATCATTA 


1200 




AATCCACCAC 


ATTTAAAAgC 


AAtGATTCCT 


TGGGAAGGCT 


TAAATGATAT 


GTATAgAGAA 


1260 


35 


GTAGCCTTTC 


ACGGAGGTAT 


mC CAG AT ACT 


GGCTTTTATC 


GTTTCTGGAC 


TCAAGGTATT 


1320 


TTTGCGAGAT 


GGACAGATAA 


TCCAAATATC 


GAAGATTTGA 


TTCAAGCACA 


ACAAGAACAT 


1380 




CCTCTGTTCG 


ATGATTTTTG 


GAAACAGCGT 


CAAGTGC CAT 


TATCACAAAT 


TAAAACACCT 


1440 


40 


CTACTAACAT 


GTGCTAGTTG 


wit 1 




ACCGTGGCTC 


TTTTGAAGGA 


1500 




TTTAAACAAG 


CTGCATCTGA 


AuftnAAn 1 




ATGGACGTAA 


AGAGTGGGAA 


1560 




AGTTACTACG 


CTAGAGAAAA 


TCTCGAACGC 


CAAAAATCAT 


TCTTTGATTT 


TTACCTTAAA 


1620 


45 


GAAGAAAATA 


ACGATTGGAA 


AGATACGCCT 


CATGTCATTT 


ATGAAGTTAG 


AGATCAATTT 


1680 




TATAAAGGCG 


AATTCAAATC 


AGOGTCACGT 


GTCCCTTTAC 


CTAACGCAGA 


ATATACACCA 


1740 




TTGTATTTGA 


ATGCTGAAAA 


TCACACATTG 


AATCATGCAA 


AGATTAGTAG 


CGCGCATGTC 


1800 


60 


GCACAATATG 


ACTCTGAAGA 


TAAACAACAA 


GATGTAAGTT 


TTAAATATAC 


GTTTGACAAA 


1860 




GATACTGAGT 


TAGTTGGAAA 


CATGAACTTA 


AAACTATGGG 


TAAGCACTAA 


AGACTCAGAT 


1920 
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is 



20 



25 



30 



35 



40 



45 



SO 



CCTGATTTTA ATCATATTGA AAATGGTCAA GTAGCTACTG GTTGGTTACG CGTATCACAT 2040 

CGTGAATTAG ATCAAGAAAA ATCCTCAATC GCGCAACCTT GGCATAAACA TGAAACAGAA 2100 

TTAAAGTTGT CACAAGATGA GATTGTACCT GTTGAAATCG AATTGTTACC TTCAGGCACG 2160 

CTATTTAAAC AAGGCGAAAC ATTGGAAGTT GTTGTAAAGG GTAGTGAAAT TGTAATTGGT 2220 

AATAGTACTC CTGGCATGAA AACACGTTAT GAACATGAAG AAACCGTAAA TAAAGGCATG 2280 

CACATGATTT ATACTGGTGG TAAATATGAT TCACAATTAA TCATTCCTAT CGTTAATTGA 2340 

TATGCAG CAA TTACGGTCGC TTTTGATTAA AAGTGACATA GTGATAGGAC TGTATAACAA 24 00 

GAGAAAGCCA CACGCTTGGA ATCTTAAACC AAGGTGTGGC CCTTTTTATT ATTGATGGCT 2460 

ATTTAATTTT ATAACACTAT CGTATTTTCT TTTTCATGAA TCATTTCAAT AATGACATTA 2520 

TCTTCATTCA TTACTGCTAC TTTAGGTGCA TGGTTTTTAA TTTCTTCTTC ATTCAACTGT 2500 

GCATAAGTCA TGATTATGAC TACATCGCCT ACTTCAACAA GTCTTGACGC TGCACCGTTT 2640 

AAACAAATTT TACCACTACC TCTTTCACCA GCTATTACGT ATGTTTCAAA AOGTGCACCA 2700 

TTATTATTAT TCACGATGGC TACTTTTTCA TTTGGCAAGA TGT CTACCGC TTCCAATATA 2760 

TCTGAATCAA TCGTAATGCT ACCTACATAA TTTAAATTTG ACTCAGTCAC TCTTGCTCTA 2820 

TGAATTTTAG CATTCATCAT TGTTCTTATC ACTTTATTCA GCTCCAATTA TTATATT AT C 2860 

TATTAAACGC GCTTTTGAAA ATTTAACAGC TAAcGAGATA AATATGCGTC CAGTTATTTC 2940 

GTGTTGTTCT ACTAATTGAG GATAACTATA AACAGCAACT TCTTCAATGC GTTCACTTAT 3000 

ATGTGATTCA AGATATTCAG TAACCCTGTC TATAATTACT TTACTTTGAC GTTCACCGTC 3060 

TTGATACAAC GCTTGTGCTA ATAGCAAACT TTTACTTAAA TGTACCGCTT CTTGTCGTTC 3120 

TTGCTCCGTT AAATAAACAT TTCTTGAACT TTTCGCCAAA CCATCTGCTT CTCGAACGAT 3180 

ATCAATACCA ATAATTTCAA CGGCATGATT GAAGTCTTTT ACCmTTTGCT CGaCAATAGC 324 0 

CAATTGCTGG GCATCTTTTT TACCAAAATA AGCATAATCC GGCATAACAA TATTAAATAG 3300 

CTTATTAACT ACTGTTACCA CCCCATCAAA ATGCCCTGGr CCGtTCGCTC CTTCTAACAC 3360 

ATCAGCTAAT GGGCCTACTT TGACATCAAT ACCTAATTCA CCTGGATACA TATCTTCTAC 3420 

TGCAGGATGA AAAACAATGT CCGCTCCTAC TTCTGATACT AATTCTAAAT CTTTATCAAT 3480 

TTGTCTCGGA TAAGCATCGA AATCTTCGTT TGGACCAAAT TGTAATGGAT TAACAAATAC 354 0 

ACTCACAATT GTAATATCAT TTGTACTAAC TGATTCGCGT AC CATCGTTA AATGTCCATC 3600 

ATGTAAGGCA CCCATTGTTG GGATAAAACC AATCGTTGTG CCTGAGCGTT TGGCTGCTTT 3 660 

AACAATGTGT TGCATCTCTT TTACCGTAGT AATCAGCTTA GTCATTGTTA TTAACCTCAT 3 720 



55 



851 



EP0 786 519 A2 



10 



15 



GATCGTATTG TTTTAAACCA TCCACACCAA CACTAAAATC AGCAAATTGC TTCACAAATT 3840 

TCGCTTTATG TTCAACACCA TAATTTAACA TATCGTGATA AACCAATACT TGACCATCTG 3900 

TACCTTTTCC TGCACCAATA CCAATGACTG GAATTGTTAA GTGCTTGCTA ATTTCTTCTG 3960 

CTAAATCATT TGGAATTGCT TCAAGTACTA ACGCAACTGC ACCAGCTTGT TCTACATTTT 4020 

TCGCGTCTAA AATAAGTTGc TCCGCTGCTT CTTTCGTTGC ACCTTGTAAT TTATACCCCA 4080 

TAACGCCAAC ACTTTGAGGT GTTAATCCTA AATGTGCAAC AACAGGAATA CCAATTGCCG 4140 

TTGCTTTTTC AATAAATGGT GTAATATGCG CTCCTTCTGC TTTAATTGCA TTTGCATTCG 4200 

TCTCCTGATA AAGCTTTAGA GCATGATTTA AGTCTTGTGT CATAGAGATG CCTACTGCAC 4260 

CAATCGGCAT ATCAACAACT ACAAATGTAT TTGGTGCGCC TCTTCTTACT GCAOGACCGT 4320 

GATGAATCAT ATCTGCTAAC GTCACTTGTA CGGTACTTTC ATAACCTAAT ACAGTCATAC 4380 

20 CAAGTGAATC CCCAACAAGA ATCATATCAA TACCCGCTGC TTCCACTTGT TTAGCACTTG 4440 

GAAAATCATA AGCTGTTACC ATAGAAATTT TAGTTTGCTT TTGTTTCATA TCTATTAATT 4500 

GACTTACTGT TTTCAATGTT ATTCAACCTC TTTTTGCAGT ATnATTAGA 4549 
2$ (2) INFORMATION FOR SEQ ID NO: 175: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6339 base pairs 

(B) TYPE: nucleic acid 
3Q (C) STRANDEDNESS : doaible 

(D) TOPOLOGY: linear 



35 



40 



50 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 175: 

TTATCTTTTG TTGTTTCCTT AGACAAACGA CTAACCACAT TATAATGGAC TAATTTATTA 60 

ATTFTATTTA ATTCCATTAA GTTATCCGTA ACACTAAGTG AAGATGCGGA GTTCACTCTC 12 0 

GTTTGTACTC TTCGTTTTAA TAAAGCACCT CGTAATAATA CAATCATTCT TCTTATTAAT 180 

GATGCTTGTC TATATACCTG TGTTCTTTCA GCATAACGCA TATAGTTTTC AAGTACACTA 24 0 

TTCGTTATTT GTCCTTCATC TACTAAAGAC TCTAATGTTT TkGTTTCTAC ATTAAAAGCA 300 

ATTTTTTGTA GACGTTCTAA TTCTTTAGAG TTTTCATCAT CTTTCTCTAC AGTTTTTAAA 3 60 

AATGCTAATT TATCATGATA TTCTTTAATC AOGTTACCAT ATTTAAAACT TGTTTCGAAA 420 

GTAGATTTTT GATTTAGATA ATCAATAACT TGTTCTAATA TATAAATTCT AGCAACTTTA 480 

AACGACATAT TGCCAATTAC TGTTTTAGGT GCAGGTTTCG TTAATAATGG CAATAATACT 54 0 

TGCGCAACTA CCAAACTAAT AATAACCATA CCAGATGCAA TAAATAATAA GTCGTTTCTA 600 
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ATTGTTCCAT GCACACCACA TAACGTCATA ATTAAAGCGT ATAAACTTCG CTTTGOTGGT 720 

TTCTCAGTCG TTGGATTATC ATCATCATTT TTAGTCATCA TTTTTTGGAA TGGACTGATG 760 

GCTAAATAAA AATAAGGATA TAAGACATAA ACCCAAACAA ATCTAAATAG ATAGACAGCT 840 

AAAGCAACAA CAATAGTGAT GCCTATTAAA AAGATTAAAT TGTGCGGTTC TGTTTTGATA 900 

ATTTTAATAA TAACTTCAGG TACTAAAAAT CCTAATATTG AAAAAACAAA GCCATTTAAA 960 

ACATAACCTA GTATATTCCA TGTATGATTG TAACTCATTT GCAGTTGTGT AOGTACTTGC 1020 

ATAATTCTGT CACGTTCGAA ACCATGTACA AGTCCTGCAA CTACTGCTGC AATGATTCCT 1080 

GATGCGTGaA ACAATTCAGC AATTAAATAC GTAACAAATG GTGTTAACAA TTGAATAATT 1140 

GTAAACATAT TAATGTTTTC ATATCCTCGA CGCATCAATG TTAATCGGAA CCTTACTAAT 1200 

GCCATACCTA TAAGTAAACC AACCACTGCG CCACCAATTG ATGCAATTAA AAACAACTGA 1260 

2 0 ACAGCATCAA CAAGTGAAAA AGCACCTGTA ACTAATACTC CAACAGCTAT TTTAAATGAA 1320 

ATAATACCAG CAGCATCATT CAATAATGAC TCACCTTCAA GAATTGTCAT TGCTCCTTTT 1380 

GGCAAGACCT TTCCTTTAGT GATTGCTTGC ACTGCTACTG CATCAGTAGG ACAAAGAATG 1440 

2& GCAGCAATTG CAAATGCTGC TCCAATAGGT AAATCTGGCC AAATCCAATG AATAAATAAA 1500 

CCTACACCTA TCACAGTAGT AATGACTAAT CCTAATGCCA TCATCATCAC TGGCTTAATA 1560 

TATTTCCTTA AATGGACTCT AGAAACATTA ACACCTTCTA CAAATAACAA AGGCGCAATC 1620 

ATTGTTACCA TAAACAATTC AGAATCAAAA TTAAATTGAA CAGGGATTGG GGTAATAAAT 1680 

AGTAACATGC CCAAGAAAAT TTGTATAAAT GCTAGGGGTA CTTTAGGTAT GAAAGTATGG 1740 

ACAAACGAAC TTAGTATCAC AACAG CTATA AATATAAGAA TTGTTTCAAA TATTTCCAAA 1800 

CTTTCACCTC TCTAAAAAGT ATTGTTTAAT TGAAAATTAA GTATCACATC TCGTTGTAAT 1860 

TATACTTTAG AGGATAAATT GAGTTAGCGA CCACAAAAGC ACTTTAATAT AGATATATGT 1920 

CTACGATTGC AGTACTTAAA TTTGCAATTA TTTAATTTTA TTTTATCACT AATTGTTTGT 1980 

ATAAATAAAC AACTTGCTTT CACATAACAA CATTAACTTA TAATACAAAA AATGAGCACC 2040 

TTAAAATCGA CTAACCAATT TCaAAGTACT CTTTTAATGA TTAATTTTGA AAACAGATTT 2100 

45 TCaAAAGCAT TGTTATGCTT AACAATTTAG CCAACACTTC AATCGTTTTG ATACCATTTC 2160 

TTACGATGCT CTTCTCGTTT TTCAGCACGT AATTGTAATG CTTCTGTAGA GTTTTGTTCA 2220 

TTTGAACTTA ATAATATTGA TGCATGTGTG TGAGCATCAT TTTTTCGATA CATATAAGCG 2280 

60 CCGTTGCGAT AAGCAGCGCG AGCGACTAAG TGCATGCCGA CTGGTGAAGT TAAATTAATA 2340 

AAAACAAGTG ACAGTAATAA ACGCACACTG AAAAATCCTG TATTCACAAT AAAATAAATT 2400 
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CTTAAGAAAA CATCTTGGAA TTTCACGATA CCTATTQCAC TAATAAGAGC AATAAAACTA 2520 

CCTAACAACA ACATCACAGC AGCAATAAOA CTAAAGATTT CTTTTGTTAT TTCCATTAAA 2580 

CACATGCCCC CCACCAATAA AGCGTGATAT TGAAACAGAA CTTACAAAAG ATATAATGGC 2640 

AATGAGCATG ATTGAATCTA AGAAAGAAAC GGTGCCCATA AGTACACTTA ACACACCCAC 2700 

AATTGACATT ACGACAG CAC TTGTTGTATC AAATGTAACG ACACGATCTG CTGTTGTAGG 2760 

TCCCTTGATT AATCTAAATA AACAGATGAT TAATGCAATT CCAAAAATAA TGAGTGAACT 2820 

AATAATCATA ATATGTGTTA TTGTTTGTAT CATCGCGACA CCTCCAATAT TAAGTCTTCA 2880 

TAATGCTTAA TACTTCTTAA CAAACTATCT TTT TCTTTTT CTGACACGTC GATACTATGA 2940 

ATAAAAAACT TTTTAGAGTC TTGAGAAATT CGTATTACTG TAGACCCTGG AGTTATAATA 3000 

ATTAAAATTG TTAAAAATGT TATTGACCAA TCACTTGTTA GTCTTGTTTC ATATGAAAGT 3060 

20 AATCCAGGGT TCATATCTTT TGTTTTAAAA AGAATATAAT TAATCGTGCT AATGCTAGAT 3120 

GTTATTAATT GATATAAATA AACACCTAAA AATTTAATAG CTACCCATAT TTTTCTAACA 3180 

TAAAAATCAT CGCTGAAAAA CCTGTGTAAT ATATAAATGA CAATTAAACC AATTAGATAT 3240 

25 CCAGAAAAGA AAGTCGAGAA TTTAAAATGA TCTTCATCTT GAAATAATAC CCATAAGAAT 33 00 

GCAATGATAA TATTTAAAAC TATTTGATTC ATTTAGTCCT CTCCTTTCAA ATGCGGATTT 3360 

ACAAGTTTTT GATATAATTG ATCACTCGTG TTCAACTCAG TTG CATCACT TGTAACATTT 3420 

30 

AACACAACAG GTGCAGCAAT TCCGATTGCG ATAACCACAA CTACTAAAAT ACTTAAAATT 3480 

CTTTTTCGAT ATAGCGGGAT TTTCTTAAAA TTAACTTCCT CCCCATCTTT ATCTCCAAAA 3540 

TACATATAAA AAAGTATCCT AAATAAACTG T ACATTG CAA TTAGACTAGT AATAATCATT 3600 

35 .. . , 

AACGCTAGTC CAATATAATT GCCATTTTGC AATGCACCTT GGAAAATAAG TACTTTCCCC 3660 

GGAAAGCCAC TAAATGGAGG CACGCCGCCA ATAGCAAAAA TCATTATAAT AAACGCAACT 3720 

CCAAATAAAG GTTCTTTTTT AGCTAAGCCA TTCAAATATT GATATTGTCG ATAGCCTGTA 37 80 

40 

ATGTAAACTA AACTACCAAT AATAAAAAAT AGCAATGTTT TTACAACAAT GTCATTTACC 384 0 

AAATAAAATA TTGCACCATT AATACCTGCA AACGTGTTTG TTCCTAAACC TAAAATGATA 3900 

45 AATCCTATTG AGATTATGAC TTGGTAAGCT GCAATCTTTT TAATATCTTT ATAAGCAATG 3 960 

ACACCTATAG CGCCGATGAC CATAGTTATA GCAGCCATAG TTGCTAGCAA TGGATGTATG 4020 

AGATCATTAT GTTGATCAAA TAGTAAAGTG AAGAATCGAA TTAATGCATA GGCCCCTACT 4080 

50 TTGGTCATTA ACGCTGCAAA TAATGCTGCA AGCT CAGTAT TTAACACAGC GTAGGCTTTG 4140 

GGTAGCCACA TAAAAAGGAC CAGCGCTGCT TTCGCACTAA ATGCGACTAA GAAGATTAAT 4200 
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AAGTTTAATG TACCTACTGT TTTATAAAGT AAACCTATAC CTAATAAGAA TAGCCATGAA 4320 

CCAATAATAT TCAAGACAAC ATAAATAATT GCAGCACGTA ATTGTTCTAC AGATTGTCCA 4380 

AGTGTAATGA GTACAAATGA CGCTAGTAAC ATAATTTCAA ACATGACGTA TAAATTAAAT 4440 

AAATCTGATG TTAGAAAAGA GCCTATCACG CCAACACTTA AAAATAATAT OAACGATGGC 45 00 

AAGTGATAAC GATTTGCTTT ATGTTCGCCA CGCCCAAATC CGTATGCCAT AATTAAAGTA 4560 

ATCACAAACG AAGCGGTTGT AACCATAATT AAACTTAAAG AATCTCCTAA AAACTGTATA 4620 

CCAAAGGGCG CTGACCATCC TCCAAAGTCT AGCGTAATTG GAOGGTGACG CTGAACATAA 4680 

ATTAATAGCA TTAATGAAAT AATTGTGGTG ATAGTCATTG TACCTAAGTA TAAATATTTA 4740 

GAAATACGAT CATTATTTTT TAAAAATACA AGGATTAAGG CACAAAGGAA TGGTAATAAC 4800 

ATTGGTAAAA TCAATAAGTT ACTTAGCATC ATCTTCCCCC CTTAGGCCTT CAATTTCATC 4860 

TTCTTTTGTT ACTTTATAAG TTCTATAAAC AAGTACAAGT AAAAACGCAG TCATCCCAAA 4920 

CCCTATAACT ATTGCAGTTA GTACAATAGC TTGTAACAAG GGATCAACAA ACAATTGGTT 4980 

TCCACCAGTT ATTAGTGGTT CTGATCTACT AGAACCATAC GTTCCCATAC TCATAATAAT 5040 

GAGATTACCA GCATGAGTAT ATATTGAAAT TCCGATTACA ATACGAATTA AATTGATTGA 5100 

TAAAATCATA TATGTTCCTA TAAACACTAA AAATCCTATA ACTAGTAATA ATATTAAATT 5160 

CATGATCGAC CTCCGCTAAG CGACAACATC ACTGTGACAA TAACACCAAC AACTGAGAAT 5220 

AAAATACCTA ATTCAAAAAG TGTTATTGTA CTTACATGAA TTTGTCCTAA AATTGGAAGT 52 80 

ATC CAAGTTG TTTCATATTG AGACAAAAAT GGTTTTCCAA AAAACATAGG TATTATCGCA 5340 

GTAATAGATG ATACCAATGC TCCAATAATC ATTAAAATTC TAAAATCAAT CGGTAAACTT 5400 

TCTAAAACCT CTTCAACATT AAAAGCCAGA AACATTAAAA TAAACGCTGA ACTAAATATT 5460 

AAACCACCAA TAAACCCACC ACCAGGATTA TTATGACCTG CGAAGAAGAC ATAGAATCCG 5520 

AAAGTCAATA AAATAAATAC AACAAGTTTC GTGAC CGTTC TTAACACGAC ATCATTCTCT 5580 

TTCATCTTGT CCCCTCCGAT CTTGATAATT TAATAATGtg TAAATACCTA GCCCAGTAAT 5640 

AATTAACACT AATCCTTCAA ATAATGTATC TAATG CTCTA AAGTCACCAA GTATCGCATT 5700 

TACAATATTT TTACCACCTG TTAGTTTGTC AGCTTTTAAA TAAAAGTCTG ATATTGATGA 5760 

TAAACCATCT GTTTGTTGTG TAATAAAAAT TAATGATACA ACAATAAGTG CCATCAAGAG 5820 

TGATACAGAA ATTTTAATTA TTTCTCTTTT TTTGTTAGCG TTAGATCTTG GCACGTTTGG 5880 

TAATCTTGAA AAACTGACAA TAAATAGTAT CGTCGTTATT GTTTCAACTA CTAGCTGAGT 5940 

CAATGCTAGA TCAGGGGCTT TCATTG CTAT AAAGAATAAG GTCACAACAA ATCCGATGAC 6000 
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GACAGTTACG ATTGCTAATA TAATTTCTAA TOCCCCAAAT TCAGAAACAT GTAACTGATG 6120 

TACTTTAGGA AGTCCaATTC GAATATAACC AT ATC CAATG ATAATCATAA ATATGCCTAA 6180 

6 GGTCATAATA ATGTACTGGT TTAAACGATC TTGCATAACA CGTTTAAATC GCTTCGTAGC 6240 

AAACTTTTCA AAATGTCGAT ATACCATCTC ATAGCTTTTT GAAACTGAAA TCTGTCTAAT 6300 

TTTACCTGTG AACACTTTTT TCCAATCTAC TTTGATTGCT AGTACACTAC CCAATAAAAT 6360 

10 

AATGATGATG GTTAAAAGAA GCGGTATGTT AAATCCATGC CATTGCGAAA CATGTGGTGC 6420 

CAATTGATCA ATTTGATGAT TACCACCTGA TACAGCTCTT AATGCnAGAA CGATAATCCC 6480 

CTTCCCAAAT ATATnTGGTA CAAAAAAGAT TACAGGTACT AGCACCATTA aTATAAGAGA 6540 

15 

TGGTAAACTA aACAACCATG GTTCGTGGAT ATTTTTTTTA GTAAAAACCT TAGAATCATA 6600 

TTTTGtCCAA AATACTTCTT TTACCATGTA TAGTGCATAT GTGAATGTAA AAACACTCGC 6660 

2Q AATAACACCA ACAAACACGA TAGCTATCAT TGAAATCAAA CTAAATTGGG ATAATTGTCC 6720 

AGTTTGTGTT AATGCATCTA AAAACATTTC TTTACTTAAA AATCCATTTA AAAATGGTAC 6780 

TCCAGCCATA GATAGAGCCG CTATCGTCAT GACTAGATTC ATTTTAGGAA ATAGTTGACG 6840 

25 CATTCCACTT AAAATTCGTA TATCCCTTGA ACCTGCTTCA TGATCTAAAA TACCTACTCC 6900 

CATGAAAAGC GCACATTTAA AGATGGCATG ATTCATTAGa TGAAATAGcG CACCArATAA 696 0 

TACmAATACA TAAATaGATG CTATTG CGTC TTGTTGGTGT TGAGCATATC CGCCACCTAT 7020 

30 ACCCACCATA GCCATAATCA TCCCAAGTTG ACTGATTGTA GAGTACGCTA GGATACCTTT 7080 

TAAATCCCAT TGTTTTAAAG CTGTAATTGA ACCAAATAAC ATTGTTATTA AACCAACAAA 7140 

CGTAACGATA TATACGTACA TATTGCTAnG ACCTAATAAT GGTGTAAATC GAAGTAATAG 7200 

35 

AAnGATACCA GCTTTTACCA TCGTGGCTGA ATGTAAATAA GCACTTACAG GTGTAGGTGC 7260 

AGCCATTGCT CTAGGTAGCC AGTATGAAAT GGAraTTGTG CTGATTTTGT AAATG CACCT 7320 

AATAAAAACA TAAAAATCAT AGGGATAAAC AATCCATGAT TCTTAATATG ATCTG CTTGT 738 0 

40 

CCTAATATCT CTGTGATGTT ATTCGTTCCT GTCATGATAT ACAGCATAAT AAAACCAACT 7440 

AATAACGCCA ATCCACCAAA TACTGTAATC ATAAATGATT GAATCGCACC AAATTGACTG 7500 

TCACCATTGT TATACCAATA TGAnATCAAT AAAAATGATG ATmCACTCGT TAATTCCCAA 7560 

45 

AAaATGTACA TCmATATCGT ATTGTCTGAT AATACaaTAC CAATCATACT GAACATAAAT 7620 

AACGTTAAAT AAAAATAAAA CCTTGGTAAA TTGTCTTTTC GAGAGGATAA ATATTGAGTT 7680 

SO G CAT AGAAG A ATACTGCAAT TCCAATAAGT GAAATAATAA GAGAAAACAT TAAACTTAAA 7740 

CCATCTAAAC GTAAATCTAA ATTAATATCT AATGTCTTAA TCCATGGAAT AGAGGTAGAA 7800 
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GGTGCAACCA ACGCTATGTA CCCGGCATAT TTAGCCAATG CTCTACGTTT AGACATTAGA 7920 

AGTATCATCG CCATAATCAC AAGTATAGCA ATTAATAAAT AAACCAAACT CATTATTAGC 7980 

5 

CTCCTTTGTT TCTATAATTG TAATGAAATA TAAATACTAT GTTCACACTC ATTTTCTAAA 8040 

CCGATAAAAT TTAGTGTTTC AATAGCAGAT TGATGCCCTA AATACTTTTG AATGACTGGT 8100 

ATAAGTATAC CTTTTTGATA AGCATGATAT GCAAATGTCT TACGCAATGT CGTTAGTCCT 8160 

10 

ACATTATCTA TACCAGCTTC AATTGATGCT TGGTGAATTA TTCGATATGC TTGCTGTCTA 8220 

GATAATACTT GATTTGTTCG TAGTGATTGA AAAAGAACGT CTTCATTCGA AAGACTCCTG 8280 

rs TCCTCTATAT ATTGAAGTAG TTCTTTCGAT AATGTTTCTG GTAACCTAAT TTTAATCAA 8339 

(2) INFORMATION FOR SEQ ID NO: 176: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 588 base pairs 
so (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 176: 

CCCGATTTTT TTACGTAATC TAATACATAC GGCAAAATCA ACTTTAATCA AAAAAGACTC 60 

ATACACAATG CCTTTAAAGC ACATGTATGA GTCCTTTTTA GTAGTTTATA TCAAAAAATA 120 

30 

GTTTAATGTA TAAATTAGTT TTTGTTTACA GATGCGTCGT AGATTGATTC TACAGCATCA 180 

CCTAAAGCTT TATCGAATTC TTCTTTAGAT TGATCAGCTC TTAAATCACT AGCTAATGCA 240 

CGTGAGAAAC TTGCGATAAG TTCAGCGTTA TCTTTAAGTA ATTCATTTGC TTTTTCTCTG 300 

35 

CTGTAACCAC CTGATAATAC AACGACACGA ACAACATTAG GATGTTCAGC TAACTCTTTG 360 

TATAAGTTTG GTTCAGTAGG AATTGTTAAT TTCAACATTA CTAATTGATC AGCATTTAAG 420 

40 CTATCTAAAC CTTTTTTAAG TTCAGCTTTT AATACTTTTT CAATTTCAGC TTTGTCTTTT 4 80 

GCATTAATAT TAACTTCTGG TTCGATAATT GGAACTAAAC CTTTAGCAAT AATTTGTTTA 540 

GCAACTTCAA ATTGTTGTTC AACAACGTCT TTGATACCTT GCTCATTT 588 

45 (2) INFORMATION FOR SEQ ID NO: 177: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2841 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ATAGAGTnCT GGnACTTACT ATGACATATG GCGCTAGAAT GGCTGAGCCA GGTGAATTTA 60 

CAAAACGTGC CTTTTTAAAT GGTCGTATTG ATTTATCTCA AG CTGAAGCA GTTATGGACT 120 

TTATTCGCTC GAAGACAGAT AGAGCTTCTA AAGTTGCGAT GAATCAAATT GAAGGTCGTC 180 

TAAGTGACTT AATCAAAAAA CAACGTCAAT CTATATTAGA GATACTCGCT CAAGTGGAAG 240 

TCAATATTGA TTATCCTGAA TACGATGATG TTGAAGATGC OACTACTGAA TTTCTTTTAG 300 

AGCAGTCTAA AGAAATCAAA CAGGAAATTA ATCGTTTATT AGATACCGGT GCGCAGGGTA 360 

AAATTATGCG TGAAGGTTTA TCTACAGTTA TTGTTGGTAA ACCAAACGTA GGTAAATCAT 420 

CGATGTTAAA TAATTTAATA CAAGATAATA AAGCGATTGT AACTGAGGTA GCAGGTACTA 480 

CTAGAGATGT CTTAGAAGAG TACGTCAATG TTCGTGGCGT GCCATTAAGA TTAGTTGATA 540 

CTGCTGGTAT ACGTGAGACA GAAGATATAG TAGAGAAGAT TGGTGTTOAA CGCTCTAGAA 600 

AOGCTCTTAG CCAAGCAGAC TTAATTTTAT TTGTATTAAA CAATAACGAA GCATTGACwC 660 

AAGAAGATTA CACATTATAT GAAGTGGTTA AAAATGAAGA TGTAATCGTA ATTGTTAATA 720 

AAATGGATTT AGAGCAAAAC ATAGATATTA ATGAAGTTAA AGATATGATA GGTGATACGC 780 

CATTAATTCA AACTTCAATG TTAAAACAAG AAGGTATTGA TGaATTAGAA ATACAAATTC 840 

gAGATTTGTT CTTTGGTGGa GAAGTACAAA ATCAAGATAT GACTTATGTT TCTAATTCAA 900 

GACATATTTC ATTATTAAAA CAAGCAAGAC AAAC GAT ACA AGATGCGATT GATGCAGCAG 960 

AATCTGGTGT GCCTATGGaT ATGGTACAAA TTGATTTAAC TAGAACTTGG GAAATATTAG 1020 

GAGAAATTAT TGGTGAGACT G CAAg TGATG AACTCATCGA TCAGTTATTC AGTCAATTCT 10B0 

GCTTAGGTAA ATAGTAATTG AAATAGACGG AATACCGTCT TAAGAAGGCT AGTAAGATAT 114 0 

35 CAAATAAGGA GGTTTATATT GTGGTTCAAG AATATGATGT AATCGTTATA GGTGCGGGAC 1200 

ATGCAGGTGT AGAAGCAGGT TTAGCATCTG CAAGACGTGG TGCTAAAACA TTAATGCTAA 1260 

CAATAAATTT AGATAATATT GCATTTATGC CATGTAACCC ATCTGTAGGT GGACCAGCTA 1320 

40 AAGGTATCGT TGTTCGTGAA ATTGATGCTT TAGGTGGACA AATGGCAAAA ACAAT CGATA 13 BO 

AAACACACAT TCAAATGAGA ATGTTAAATA CAGGTAAAGG ACCTGCTGTA AGAG CACTAA 1440 

GAGCGCAAgc AGaTAAAGTA CTTTATCAAC AAGAAATGAA ACGCGTGATT GAAGATGAAG 1500 

45 

AAAATTTGCA TATAATGCAA GGTATGGTAG ACGAACTTAT TATAGAAGAT AATGAAGTTA 1560 

AAGGTGTACG TACAAATATT GGTACAGAGT ATTTATCTAA AGCAGTAATT ATTACAACGG 1620 

GAACATTTTT ACGTGGTGAA ATCATTTTAG GTAATATGAA GTATTCAAGT GGACCAAATC 1680 

ACCAATTACC ATCAATCACA TTATCAGACA ATTTAAGAGA ACTTGGTTTT GATATTGTTC 174 0 
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AAATACAACC AGGTGACGAT GTAGGTCGTG CATTCAGCTT TGAAACAACA 

TAGATCAATT GCCATGTTGG CTAACGTATA CTAATGCTGA AACACACAAA 

ATAATTTACA TCTATCTGCA ATGTATTCAG GGATGATTAA AGGAACCGGG 

GCCCTTCAAT TGAAGATAAA TTTGTTCGAT TTAATGATAA GCCGCGACAT 

TAGAGCCTGA AGGTOGTAAT ACAAATGAAG TATATGTGCA AGGATTGTCT 

CTGAACATGT GCAcGTCAAA TGTTAGAGAC GATACCAGGT CTTGAAAAAG 

GCGTGCCGGC TACGCAATTG AATATGATGC GATTGTGCCA ACGCAGTTAT 

TGAAACGAAA ATGATTAAAA ACTTATATAC TGCAGGTCAA ATTAATGGTA 

TGAAGAAGCA GCAGGACAAG GATTGATGGC AGGTATTAAC GCTGCAGGTA 

CACAGGCGAA AAGATATTAA GTCGTTCAGA TGCATATATT GGTGTCTTAA 

TGTAACTAAA GGTACTAATG AACCTTATCG TTTACTAACA TCACGTGCAG 

GTTAcTACGT CATGATAATG CTGATTTGAG ATTGACGGAT ATGGGATATG 

GATTTCTGAA GAAAGATATG CACGTTTTAA TGAAAAACGT CAGCAAATTG 

TAAGCGTTTA TCAGATATTC GTATTAAACC AAACGAACAT ACGCAAGCGA 

ACATGGTGGT TCTCGCTTAA AAGATGGTAT TTTAGCTATC GATTTATTAC 

AATGACTTAC GATATAATTT TAGAACTTTT AGAAGAAGAA CATCAATTGA 

TGAAGAACAA GTAGAAATAC AAACAAAATA TGAAGGTTAT ATCAATAAAT 

AGTTGAGAAA GTTAAGCGTA T 

(2) INFORMATION FOR SEQ ID NO: 176: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3025 base pairs 
Z (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 178: 
ATCTAATTTC AAACCCGGTG ATAAATTGCC AAGCGTGACG CAATTAAAAG AACGTTATCA 
AGTAAGTAAG AGTACTATCA TTAAAGCATT AGGCTTATTG GAACAAGATG GTTTGATCTA 
TCAAGCACAA GGCAGTGGTA TTTATGTGAG AAATATTGCT GATGCCAATC GTATCAACGT 
CTTTAAGACT AATGGTTTCT CTAAAAGTTT AGGTGAACAC CGAATGACAA GTAAGGTACT 
TGTTTTTAAG GAGATTGCAA CGCCACCTAA ATCTGTACAA GATGAGCTCC AATTAAATGC 



GAATATATAT 

GTTATCGATG 

CCACGTTATT 

CAACTTTTCT 

ACAAGTCTTC 

CAGATATGAT 

GGCCTACACT 

CATCTGGTTA 

AAGTGTTAAA 

TCGATGATCT 

AATATCGTTT 

AACTTGGTAT 

ATGCGGAAAT 

TTATTGAACA 

GCAGACCTGA 

ATGCAGATGT 

CACTACAACA 



1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2841 



60 
120 
180 
240 
300 
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CGAATATTCT TATTATCATA AAGAAATCGT GAAATATTTA AATGATGATA TTOCTAAGGO 420 

CTCTATCTTC GACTATTTAG AATCAAACAT GAAACTTCGT ATTGGTTTTT CAGATATTTT 480 

CTTTAATGTA GATCAACTCA CTTCAAGTGA AG CTTCATTA CTACAATTGT CTACAGGTGA 540 

ACCATGTTTA CGTTACCACC AGACTTTTTA TACAATGACT GGCAAACCCT TTGATTCATC 600 

TGACATCGTA TTTCATTATC GTCATGCACA GTTTTATATT CCTAGTAAAA AGTAATAAAT 660 

ACATAAAAAC GTCTATATCC CAGTTATAAA CTGGAGTATA GACGTTTTTT TACGATAATA 720 

ACAATGGCTC AAATTGCTAT TATCTTGCTT AGGTTTTTCG TTTTAGAAGA ATATTGCTAC 730 

AAAGACAGGC ACAACTGCTA CAACAACTAC ACCAACTAAC ACTAAAGCTA TACTTGCCAT 840 

TGATTCTTCT ACAGGTCCTA ATTCTTTGGC TGGTGCTACA CCTAATGTGT GACCACTTGT 900 

TCCAAGTGCT AATCCTCGGG CAATAGGGTT AGTAATTCGG AAAAGCTTTA AGAATTTATT 960 

ACCTAGGGCA TAAATAATGA CACCATTTAA AATAACTGCT AATGATGTTA ATTOTTTTAT 1020 

ACCACCGATA CCAGCTGATA CTGGTAACGC AATCGCTGTA GTTGCTGCTT GAGGTAACAT 1080 

TGATAAAATA ACATCATTGG CAAATTGTGC TAACTTCGCA AAAGTTAAAA TAATTAATAA 1140 

CGCTACAACT GTACCGATAC CAATACCTCC GATGATACGA TGCCAATGTT TAACAAGCAC 1200 

TTCACGCTTT TTATATAACG GAATCGCAAA ACAGATTGTT GCCGGTTCTA AGAAGAAGTA 1260 

AATAATGTCT CCACCTATTT TGTAAGTCTT ATACGGAATG CCTGTTAAAT AGAGGAAGGC 1320 

30 CACACCAAAT AC CAT ACTG A CAAATAGCGG TGCGAATAAG AAGAAACGAT TAGTTTTTTC 1380 

AAATAATATG GTCGCTAAGA AAAATGGTAT AACGGATAAC AGTATTCCGA AGTAAGGTGT 144 0 

GTTTaGTGCT AAGTGGTTAA TCaTGAG CTT GTGCCTCCTC TATTTTGATC TTTTTTGTGA 1500 

35 CTTTGTCACC TTTAGATCTC GAAGTAACTT TCATAATAAT TTgTGTGACA TAGCCAGTAC 1560 

AAATfiAGTAA TAGTATTGTT GAGACGATTA TTAGTCCAAT GATTAAAAAT GGTGCTTGGC 1620 

TAATGACAC C TAAAGAGTTA ACAACTGAGA TACCGGCTGG TACGAAGAGT AAGCCAATGT 168 0 

TATTTGTTAG TGTCGTTCCT ACTTTTTCGA CTTCGCCTAA CTTAACAGCA CCAGTACATA 174 0 

ATAATACAAA TAATAATACT AAACCGATTA CTGATGGAGG CATAGGAATT GG CATAAATG 1800 

ATTCAATTAT TTTCGATACA AAGAGTACTA AAG CAATTAC AATGACTTGG TGAAAAAAGT I860 

GTGCTGGTTT TGATGCGTCT TTTTGTTGTT TCACGACCAT TGCCTCCTAC GTTTGATTTA 1920 

ACTAAAGTAT AGATGGCTCA CTTCGATTTG CGTGATTTTT AGTCCGAAAT ACAAAATATC 1980 

ATAGGTAAAA TGCATAAAAA AAAGGATTAC TGTTAAAGTA ATCCTATCGA CGCTTTAAAA 204 0 

TCTTTCATAA ATGAACGTCC AACTTGCATC TTGACACCAT TTGTCAATAT TACCATATAA 2100 
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TGAATACGTA TAAAATAAGT GGGATTCAAT CGTTTTTCAT AACGATTCAA TGGCTCTGTT 2220 

GTTTCGTATT TATGATTCGT TGTATGTATG GTTGTAATAC CATTATGTGT GCCAATCCCA 2280 

5 ATAATATTTT GTTGCTTTAA CATGTOAATT TTATCGTCAA TTTCAACAGG TAAGCTTTGA 234 0 

TCAAAATTCG CCGACATATC ATTCGCAATT GCACTTGCGT TATTATCATC TTTGGCTTTA 2400 

GTOGCACGCA CTTTATTGAC TGCTTGTTCA ATACGTTTTT GACCAAACGG TTTCAAAATA 24 60 

10 

TAGTCTGTCG CATTTAATTC AAATGCCTGT ACTGCGTATT GGTCATGTGC AGTTGCAAAA 2520 

ATAATCGCAG GTGGCTCTTT CATCTTTTGA ATCTTAGCTC CTAATTCGAT CCCATTTTCA 2580 

TCCATTAAAT TGACATCTAA AAATATAATG TCATATTGAT TGATCAGTAG TGCTTCCAAT 2640 

IS 

GTTTCTTTTA CATTTTCTGC CTCATTAATT TCTTCAAAAC CACCAATTTC ATTTAATAAA 2700 

TATGTTAATT CATTACGTGC TAATGGCTCA TCATCTATGA TTAATGCTTT CATATTTATT 2760 

CCTCCTCTTG TCTTTCATAA GGAAGTACAC ACCAAAAAGT GGTACCGCTC GATGTCGATT 2820 

20 

CAAATTGTAA TGCTGCGGAT TTTCCAAATA ATCCTTTTAG GCGTAAGTTT AAATTTTCTA 2880 

AAGCACTACC AGTTCCAGAC TCTGATTCTA CAGATGTnTC TCCCaACAAA TGCATTTTAT 2940 

26 CTTTAGAAAT ACCCTGACCA TTATCTTGTA CAATAATACG TACATGTGTT GCAGTTTCTT 3000 

TAATCACTGA CACGTCAATA TCGTT 3025 
(2) INFORMATION FOR SEQ ID NO: 179; 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1689 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

3S 

- (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 179: 

ACAGAATTTC ACAGCATTTT TAGATGAAAA AATAAGCCAG TCATAGCGTT GATTTAACAA 60 

40 

ATGAATATCA AAATTTAGTG GCTTTATATC AATAAAGGGT TTGTGAATAA TTGATACTAA 120 

ATCACTTTGC ATGTCATTTG TTTGTGTCAT AACTACAACT GGCTTCATAT TTAAACGTCA 180 

CTCCATTATT TAATGTTGTT CATTTAAGCG TTTTATAATT TCATAAGCAC CTTGCTCTTT 24 0 

4S 

TAATTTGTTA CTCACTGTTT TGCCTAACTC AACCGGATCT GTTCCGTTCA TTGTATATTC 300 

AAATCGTTCT TTACCATCTG GGGTCATAAT TAAACCTGTA AATTCGATTT CGTTTTGATC 360 

TGAGATTGTA GCATATC CTG CAATTGGCAC CTGACAACTA CCATCCATTT CTGCTAAAAA 420 

SO 

CGTTCGTTCA GCAGTCACAC ATTTTGCAAC CTCATCATTA TGTACTTTGC TTAATAATGT 480 
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TAACAATGTA TCTCTATCAA OATAAGATGT TnCAATATCA TCTGACCAGC CCATTCTTCT 600 

TAAACCAGCT GCAGCTAAAA TAATCGCATC ATAATCTTCA GTTTGTAACT TTTCTAATCG €60 

6 

TGTATCTATA TTACCTCTAA TCCATTTAAT CTCTAAATTA GGATACTTAG ATAATATTTG 720 

TGCACCACGA CGTAATGAAG TAGTACCAAT AATACTGCCT TCTGGCAATT GGGATAGTGG 780 

TGTATGTGTT TTAGAAATAT ACGCATCAAA AGGTAATTCT CTATCAGGGA TACAACCTAA 840 

10 

TGTTAAACCT TCCGGAATTA CACTTGGTAC GTCTTTAAGC GAGTGTATTG CCATATCGAT 900 

ATTTTTTTCA AAAAGTTCAT GTTGTATTTC TTTAACAAAT AAGCCTTTGC CTCCGACTTT 960 

15 AGACAATTGT TTATCTACTA TACGATCGCC TTTCGTGaCA ATTTCTTTAA TTTCAATTTC 1020 

TAGATTTGGC TCGACAGCTT TTAATTTATC AATAAATTGC TGGCTTTGTG TTAAAGCTAA 1080 

TTTACyTCTT CTGGAGCCAA CGACTrATTT ACGCATGTTC AATTCCTCCT AGGAACGOAT 1140 

20 TGCTCTAGAT TATTTTCTCA ATTCACAAAA TGTGTTGCAA AAAATAAATT AATCATATTT 1200 

AAGCAAAATA AAATAATGTT ATAGTATATT AAATATCTTG AATTCAACCA TTTGTTGATT 1260 

CTAAGTAAAA TATAACTTCC ATATAATACT GTAATAATTG AAGAGAGTAT TACCTTCGGG 1320 

25 TCAATGAATA TACGTTCACC AACTGAAATT ACACCCCACT GTGTACCTAA AATAATACTA 13 80 

AATATGAGAA TTATCCACCC ACTTAACGTT GAGTAAAACA CAATTGATTC AAGTGTAGCA 1440 

ACGCTACCAA TTCTAAAGTA TTTTTGATCA AAACGTTTTT CCTTCAAATT ACGGTATTGC 1500 

30 ATGATATACA GTAATGCATT GACAAAAGCT AAGG CAAAGA AGACATAACT TAACACAGCT 1560 

AGACCGATAT GGACTAACAG TAACTCGTCT ACAACAGCAA TTTTCTGAAC CTTATTAGTA 1620 

TAATGTGTCG GTTGAAATGT ATTCATC CCT AAnAGTGTTA ACCCTATTAA ATTC CAAGG A 1680 

35 

AAAACACAG 1689 

<2) Information for seq id no: i80: 

(i) SEQUENCE CHARACTERISTICS : 
40 (A) LENGTH: 1209 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 180: 

nTGGnTGGCT TTTCCTATTG GACCAAATGG ACCnTTTACC TGGCCnTTCC CAGGACACCC 60 

50 CGCTTGTGCC CACATTCCAA TCGGAAAAGG TGTATGTGGT ACAGCCGTTT CAGAACGTCG 120 

TACACAAATT GTAGCTGATG TTCATCAATT CGAAGGACAT ATCGCTTGTG ATG CTAAT AG 180 
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CGATGCCCCT ATAAOGOATC GATTTGATCA CAATGACAAa GAaCATCTTG AaGCAATTGT 300 

TAAAATTATT GAAAaGCAAC TCGCATAAAA GGACATCAGC ATTTTCAATA AAGTGTTGAC 360 

AGTTAGCAGG AAAATGTTAC AATAATCTTT OTGTGAATTA ACGAAAGTAG CAGTTGTATA 420 

TTATTGAGCG CTATGTTGTT CCCAATOCGG ACGTGTCACG TAACTGTCGC TATAAGGTGA 480 

AGACACATAA AACAATATAT CTTAGTAAGC ATGCAACACT ITT1TTTUTT TATTCATAAC 54 0 

AACAAAAAAG AATTAAAGGA GGAGTCTTAT TATGGCTCGA TTCAGAGGTT CAAACTGOAA 600 

AAAATCTCGT CGTTTAGGTA TCTCTTTAAG OGGTACTGGT AAAGAATTAG AAAAACGTCC 660 

TTACGCACCA GGACAACATG GTCCAAACCA ACGTAAAAAA TTATCAOAAT ATGGTTTACA 720 

ATTACGTGAA AAACAAAAAT TACGTTACTT ATATGGAATG ACTGAAAGAC AATTCCGTAA 780 

CACATTTGAC ATCGCTGGTA AAAAATTCGG TGTACACGGT GAAAACTTCA TGATCTTATT 840 

AGCAAGTCGT TTAGACGCTG TTGTTTATTC ATTAGGTTTA GCTCGTACTC GTCGTCAAGC 900 

ACGTCAATTA GTTAACCACG GTCATATCTT AGTAGATGGT AAACGTGTTG ATATTCCATC 960 

TTATTCTGTT AAACCTGGTC AAACAATTTC AGTTCGTGAA AAATCTCAAA AATTAAACAT 1020 

25 CATCGTTGAA TCAGTTGAAA TCAACAATTT CGTACCTGAG TACTTAAACT TTGATGCTGA 1080 

CAGCTTAACT GGTACTTTCG TACGTTTACC AGAACGTAGC GAATTACCTG CTGAAATTAA 114 0 

CGAACAATTA ATCCGTTGAG TACT ACT CAA GATAATACGG TCAATACCAA CACCCACAAT 1200 
30 TGTGGGTGT 

(2) INFORMATION FOR SEQ ID NO: 181: 
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(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 698 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 181: 

AAATCCCTTt GTtaAAgTsC AAAtTTTTCc AACrgCTTTA AtArGACCCA TATTACCtTC 60 

TTGGATTAAA tCmAGGaATG AcATACCACG ACCaCGTATC TTTTAGCAAT ACTTACAACT 120 

AAACGTAAGT TCGCTTCTGC AAGTCTTGAT TTTGCTACTT CATCACCTTG TTCAATACGT 180 

TTGGCTAATT CGATTTCTTC TTGTGCACTT AATAAGTTAA CACGCCCAAT TTCTTTAAGG 240 

TACATACGAA CTGGGTCATT TATTTTAACA CCTGGAGGGG CACTAAGATC ACTTGGATTC 300 

AGTTTCTCGT CAGTATCTGA ACTATCTTTT TCATTAACTA GTGAAATATC ATTATCATTT 360 
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GCAATTTCTT CATGACTTAA ATGACCCTCT TTTTTACCTT TTTCAATTAA TTGCTTCTTA 



4S0 



ACATCTTCTA ATGTTAATGT CGGATCAATT GTTTGTTTTT TAATTTTAAC TGTGTTATCA 



540 



GACATGAAAC GGCCTCCCGA TTTTAAATAT GAACATTCGA AATTTATTCA ATATTGCTAT 



600 



TTTAAACGAA ATTCTTAATT AATTCCATCC ATATTTTnAA TTTTATTTTA CAAATTGGGA 



660 



ACTAAATCCC CAATATTTAT TTTTCAATAG TGGTGGTT 



696 



TO 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 182: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5147 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 182: 

ACTTGATGAT GTATACAATG TATTTCAAGA ATATTATCAA AAAACATCTA ACATTAAGTT 60 

TTGTAGAATT CACAATTCTA GCTATTATCA CTTCTCAAAA TAAAAACATC GTTCTTCTTA 120 

AAGATTTAAT TGAAACAATC CACCATAAAT ACCCTCAAAC TGTTAGAGCT CTCAATAATT 160 

TAAAAAAGCA AGGCTATCTA ATAAAAGAAC GCTCAACTGA AGATGAAAGA AAAATTTTAA 24 0 

TTCATATGGA TGACGCGCAG CAAGACCATG CTGAACAATT ATTAGCTCAA GTGAATCAAT 3 00 

TATTAGCAGA TAAAGATCAT TTACATCTTG TTTTTGAATA ATATCTCTAT TACGCAAGTG 360 

TGCTGTATTC TAAAGTGCAC TTGTGTTTTC TATTTTTTAA TAAAACCTCA GCACATAATG 420 

AACAACTTTC TATTTTCTAT ATCACTTAAA ACCATTTCCG AAATTAAACC TCAGCACATT 480 

CAAAGCCCCA CTTTATTCTT AAAAATATTT TTTAACTCAT ATG T ATT AAA CCGCTTTCAT 54 0 

TATAAAAAAT ATCTCTATAT TtTATCTGtT T t TATTAATC GAAATAGCGT GATTTTGCGG 600 

TTTTAAGCCT TTTACTTCCT GAATAAATCT TTCAGCAAAA TATTTATTTT ATAAGTTGTA 660 

AAACTTACCT TTAAATTTAA TTATAAATAT AGATTTTAGT ATTGCAATAC ATAATTCGTT 720 

ATATTATGAT GACTTTACAA ATACATACAG GGGGTATTAA TkTGAAAAAG AAAAACATtT 780 

ATTCAATTCG TAAACTAGGT GTAGGTATt G CATCTGTAAC TTTAGGTACA TTACTTATAT 84 0 

CTGGTGGCGT AACACCTGCT GCAAAtgctG CGCAACACGA TGAAGCTCAA CAAAATGCTT 900 

TTTAT CAAGT CTTAAATATG CCTAACTTAA ATGCTGATCA ACGCAATGGT TTTATCCAAA 960 

GCCTTAAAGA TGATCCAAGC CAAAGTGCTA ACGTTTTAGG TGAAGCTCAA AAACTTAATG 1020 

ACTCTCAAGC TCCAAAAGCT G ATG CGCAAC AAAATAACTT CAACAAAGAT CAACAAAGCG 1080 



864 



EP 0 786 519 A2 



AAAGTCTTAA AGACGACCCA AGCCAAAGCA 

ACGAATCTCA AGCACCGAAA GCTGATAACA 

5 ATGAAATCTT GAATATGCCT AACTTAAAOG 

TAAAAGATGA CCCAAGCCAA AGTGCTAACC 

CTCAAGCACC GAAAGOGGAT AACAAATTCA 

10 

TCTTACATTT ACCTAACTTA AAOGAAGAAC 

ATGACCCAAG CCAAAGCGCT AACCTTTTAG 

CACCAAAAGC TGACAACAAA TTCAACAAAG 

15 

ATTTACCTAA CTTAACTGAA GAACAACGTA 
CTTCAGTGAG CAAAGAAATT TTAGCAGAAG 

2Q AAGAGGAAGA CAATAACAAG CCTGGCAAAG 

ACAACAAGCC TGGTAAAGAA GACAACAACA 
GCAAAGAAGA CGGCAACAAG CCTGGTAAAG 

25 GCAACAAGCC TGGTAAAGAA GACAACAAAA 

GCAAAGAAGA TGGCAACAAA CCTGGTAAAG 
CTGGTGATAC AGTAAATGAC ATTGCAAAAG 

30 CAGATAACAA ATTAGCTGAT AAAAACATGA 

AGAAGCAACC AGCAAACCAT GCAGATGCTA 
AAGAAAATCC ATTCATCGGT ACAACTGTAT 

35 CGTTATTAGC TGGACGTCGT CGCGAACTAT 

ATTTTATCCA AACCAATTTT AACTTATATA 

TAAGAATCAT CTAAATG CAC GAGCAACATC 

40 

TTACTTTTCT AAACAACTTC TGAAACGCCT 

CATTTTTAGG CATTAAAAAA TCGAACTAGA 

GATTCATGAA TAATTAGATT TAAAATGTCA 

45 

TTAGAATATT AACGTTAGTA TAAACGTCCA 
GTATTTTAAC GTCATTTTTA ATAATGCAGA 
CGCAATGGCA ATTGATTGTG GTGAAATAAG 

SO 

TGCCACAAGT AATGAACCGC TTGTTGAAAT 



CTAAO OT TTT AGGTGAAGCT AAAAAATTAA 1200 

ATTTCAACAA AGAACAACAA AATGCTTTCT 1260 

AAGAACAACG CAATGGTTTC ATCCAAAGCT 1320 

TATTGTCAGA AGCTAAAAAG TTAAATGAAT 13 80 

ACAAAGAACA ACAAAATGCT TTCTATGAAA 1440 

AACGCAATGG TTTCATCCAA AGCCTAAAAG 1S00 

CAGAAGCTAA AAAGCTAAAT GATGCTCAAG 1560 

AACAACAAAA TGCTTTCTAT GAAATTTTAC 1620 

ACGGCTTCAT CCAAAGCCTT AAAGACOATC 1680 

CTAAAAAGCT AAACGATOCT CAAGCACCAA 1740 

AAGACAATAA CAAGCCTGGC AAAGAAGACA 1800 

AGCCTGGTAA AGAAGACAAC AACAAGCCTG 1860 

AAGACAACAA AAAACCTGGT AAAGAAGATG 192 0 

AACCTGGTAA AGAAGACGGC AACAAGCCTG IS 80 

AAGATGGTAA CGGAGTACAT GTCGTTAAAC 204 0 

CAAACGGCAC TACTGCTGAC AAAATTGCTG 2100 

TCAAACCTGG TCAAGAACTT GTTGTTGATA 216 0 

ACAAAGCTCA AGCATTACCA GAAACTGGTG 2220 

TTGGTGGATT ATCATTAGCC TTAGGTG CAG 2280 

AAAAACAAAC AATACACAAC GATAGATATC 2340 

CGTTGATTAA CACATTCTTA TTTGAAATGA 2400 

TTTTGTTGCT CAGTGCATTT TTTATTTTAC 2460 

CAACACTTTC TACTCTGATT ACATATATGA 2520 

CAAGATGCTC ATTGCATTTC GTACTAGTTC 2580 

TTTGAATCCA AGTGACAACA TTATTTATAT 264 0 

AACACAAATA AAAGCAACAA ATATAATACT 2700 

TTCTTCACCA ACTTTTTTAA CAGCTGCAGT 2760 

TTTCGCTGCT ACACCACCTG CAGTGTTAGC 2820 

TTGTTGTGCC ACTGTCGCTT GAATAGGTGC 28 80 
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TGGAGAGAAT 


AATGGGAAAA 


TTGCTCCCGC 


TTTAGCAATA 


CCTTGTCCAA 


TTGCTACAGT 


3000 


CAAACCACCG 


TATGTCATAA 


CTTTAGCAAT 


AGCTAGGATA 


GCTGAAATTG 


TAAGGATCGG 


3060 


TAACCATAAT 


TCTTTAATTG 


CTTCGACCAA 


TAAAGCACCT 


GCACTTTTCC 


ATTTTAACTT 


3120 


CGTAATTAAA ATTGTAATAA 


TTACTGTTAA 


TAAAATCGCT 


GTCCCAGTTG 


CACCAATTAA 


3160 


ATCGAGACGC 


AACGCAATTC 


CTTTAGGCGA 


TAAATCACTC 


ACAGTATTTG 


GAATTGGCAA 


3240 


TTTTATTACT 


AAACTTTCAA 


GTGCACCTCC 


AGGTTGGAAT 


AATTTTTTGA 


AGAATGGTGC 


3300 


ACTCCATACT 


AATACAAAGG 


CAGTTAAAAT 


TACGAACGGA 


CTCCAAGCAA AGACAATTTC 


3360 


TTTAGGCGTT 


CGTTTTTGAA 


TTTTATGTTC 


AGACGCTTCC 


AATCTGAAAA 


TGTTTTTCGG 


3420 


TTTAAATTTA 


CGACAAACAA 


ATGCTAACAC 


CACCATTGTT 


GCTAGTGATG 


GAATAATGTC 


3480 


TGCTAGTTCT 


GGACCATGGA 


ATATTGTTAA 


TAATAATTGT 


AATCCAGTAT 


ATGTACCACT 


3540 


CACTGTTAAA 


ATGACAGGTA 


AAATTTCTTT 


AATACCTTTC 


ATACCATCTA 


CAATGAATAC 


3600 


TAAAACAAAT 


GGAATAATAA 


AGTTTAAAAT 


TGGAAGTGTT 


AATGCTGAGT 


ATCTCGCAAC 


3660 


ATCTAATGTT 


GTAACGCCTC 


CACTTAAGTT 


AAACGTATCA 


ATAATACTAA 


CTGGTAAACC 


3720 


AATTGCACCA 


AAGGCACCCG 


CCGCACCATT 


AGCAATTAAA 


CATAACATCG 


CTGCTTTTAA 


3780 


TGGTTCAAAT 


CCAAGTTGAA 


TTAATAATAC 


TGCACAAATC 


GCAATTGGCA 


CACCAAATCC 


3B40 


TGCTGCACCT 


TCTAAAAATG 


CGTTGAAACA 


AAATCCAATT 


AATAATAGTT 


GGATTCTTTG 


3900 


GTCCACTGAA 


ATACTTGCAA 


TACTATCTTG 


AATAATAGAA 


AATTGTCCTG 


TTTTAATAGA 


3960 


AACTTTATAT 


AACCAAACTG 


CCATTAAAAC 


GATATATCCT 


ATTGGGAAAA 


TACCGGCAAC 


4 0~20 


AACGCCTTCT 


GTAATCGCAC 


CTGCTGATAC 


ACGCGCTGGT 


AATTCAAATA 


CAAATAAAGC 


4080 


CACAATCAAT 


GTAACAACCA 


AAGTTGTCAA 


TGCTGCATAA 


ATGCCTTTCA 


TTTTAAAAAC 


4140 


GGTT^AGCAT AATAAAAATA AAATAATAGG TACTGCTGCA ACTAAGGCTG 


ATAATCCGAC 


4200 


ATTATCGAAT 


GGATTTACAG 


TAAGTAGTGT 


CATAATGACT 


CCCTCTCTTT 


ATATAAAATA 


4260 


TTTATCATTC 


TGATTAATCT 


ACAACCTATT 


TCAACTTATA 


TTTTGCGATG 


ATCACATATT 


4320 


TAAAATGTAA 


CACTCCTATA 


TGTGACAGGC 


AATCGAATTT 


TTACAAAAAG 


TTCACAAAAT 


4380 


ATACACAATA 


TTTAACTATA 


ATAmATAATA 


TATCaTntTA 


ATTATAAATA 


CTAGATATTA 


4440 


TTTATAATAA 


TCTCAGGAAT 


TCGCTTCAAA 


ACTGCATCAT 


GAGAGTTTAT 


ATTTTTATTG 


4500 


AGAATCTCTC 


ATTTTATGAA 


TTGTAGGAAG 


TAAACAAAAT 


ATGACAAGCG 


TCAAACCAAT 


4560 


GATAATGATA 


AATATCATAT 


TAAACCATAG 


TAAATTGAAT 


TGATGATGGT 


GTTGTATTTG 


4620 


CCAAATTTCT 


AATACTGTGA 


AGATAGACAT 


ATAGCTCATA 


ATCTCTAAAT 


TTAACGTACT 


4680 
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AAATCGTTCA TAGTATCTAC CTGCAATGAA AAATATAAGC CAAATCACTA TAAATGCGCT 4800 

ATTAATCAAA AGCAGCACCC ATTTATCAGC AAAATTATCA GCATCCCCTO CTAAATTATA 4860 

ATGAATAGGC ACTTTGGTTG GTAATTTTGG ATAGGTCACT ACTGTATAGC ACATCATAGC 4920 

TAAGTAAATA AGTAGACTTA ATATTGTAAA AGACCTGATT TTAGACATTC TATCGCCTcT 4 980 

TcTTTACATT TTATGTATAA CACTCTGCCT ATTTTACCTT TTAATaCATT ACCCCAAcGA 5040 

TtAAaCAATA tGTAaTGATA CTATAATTGC GTCAGGAGTA TCCGCTTGTT AAATGTGCAT 5100 

AGCTTATATT TAGCTGTTTA ACATGCCACA TAATGATTCG AATTATT 5147 
(2) INFORMATION FOR SEQ ID NO: 183: 



<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1312 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

20 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 183: 

CACTTACTTC CACCATTATC ATAACTTTAA AATGGATATA nTTCATCAAA CATTATCTAA 60 

AGGCGTCGCA CCTACACCAA CACCATCCAA CAATTAACTT ACAACTCTGC GATTACTTCT 120 

TCAGCAGCAA CTTTCACnTG CGTAATACAA TCAGGTAGTC CAACCGCTTC AAAAGATGCA 180 

CCAGTTACTC TAAGTCGTGG ATATGTTTGT TTAATATGTG CTTGAATCTG TCTAATTTGT 24 0 

TGAATATGAC CGACATGGTA CTGTGGCATA CTTTTCGGCA AACGATTGAC AATTGTAAAT 300 

35 TCAGGATCAC CTTTAAATGT CATCATTTGA CTTAAATCTC TACGTACAAT CGATACTAAT 360 

TCATTATCTG TATGATCATC AACCACAGTA TCACCTGGTT TACCTACATA CGCACGAATC 420 

AAAACCTTAC CTTCCGGTGT AGTAAATGGC CATTTTTTCG ATGTCCAAGT ACATGCGGTA 480 

40 ATGTCTGTAT CACTCGTTCT CGCAATTACG AAGCCAGTAC CATCATGGGT ATTTTCAATG 540 

TCTTTTTCAT CAAATGCCAA TACAACAGTT GCAACAGTCG T ACTATC CAT CGTTTTAAAG 600 

TAATCAAATG CTGGATCTTG TCCGAACCAA TTTAAAAACA CTTGATGTGG TGTCGTTACT 660 

AATACGCCAT CATACACTTC TTCTAGTTGA TCATTGTAAA CAATTTTATA TTGTTTTTGA 720 

GATGTAATTA TATCATCCAC TGACGTATTG TAG CGTATTG TCACACCTTT ATTTTTAACA 780 

TCTTGTTCTA ATGCTTCAAT AAATGAGCTT AAACCATGCT TAAATTGTTT GAATTGTCCT 840 

TTCGGTGCGC CAGGATATAA TTGTCTTTGT TTCAGACGCT TATTTTTCTC ATCCTTCATA 900 

CCTTTTATCA GACTTCCGAA TGCCTCTTCT TTTTCTTTAA AATTAGGAAA CGTACTCATC 960 
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TCAAGTACCT CATTACCTAA TCTTGCTCTG AAAAATGCAC CAACAGAAAT GTCACCATCC 1080 

TGCATTTGAG TAGGTTTTTT TAATAAATCA AACCCTGCTC TTAATTT AC C AAGTGGCGAT 114 0 

ATTAATTTTG TAGTAACAAA TGGTTTAATA TCTGTTGGAA TACCCATAAT TGAACCACCT 1200 

GGAATCGGAT ATAATTTATT TTTCGCAAAA ATATATGATT GTCCAGTCGT ATTTGTAACA 1260 

ATATCTTGTT CTAATCCAAT ATCTTTCGCT AATTCTGTCA TAATCGTTTT TC X312 



10 

(2) INFORMATION FOR SEQ ID NO: 184: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6157 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



20 ( X i) SEQUENCE DESCRIPTION: SEQ ID NO: 184: 





TTTTACAATA 


AAAATATOAT 


ATACTACTTG 


TCGTATATAA 


GGAACGGAGG 


ACAATTTATG 


60 




CATACATTTT 


TAATCGTATT 


ATTAATCATT 


GATTGTATTG 


CATTAATAAC 


TGTTGTACTA 


120 


25 


CTCCAAGAAG 


GTAAAAGCAG 


TGGACTTTCA 


GGTGCCATCA 


GTGGTGGTGC 


TGAGCAGTTA 


180 




TTCGGTAAAC 


AAAAACAACG 


TGGCGTCGAT 


TTATTCTTAA 


ATAGATTAAC 


AATTATTTTA 


240 


30 


TCAATATTAT 


TTTTTGTACT 


TATGATTTGC 


ATAAGTTATC 


TTGGTATGTA 


AGGTCCGGCG 


300 


ATGTAAATGT 


CGGGCTTTTT 


TATTTATAAT 


TAAGAATGTA 


ATAGTTTAAC 


AATAAGCTAT 


360 




GTAAAATATA 


TAGCCTAGTT 


AAGTATGCAA 


AGGGAGCGTT 


AGATTTATGC 


AGATAAAATT 


420 


35 


ACCAAAACCT 


TTCTTTTTTG 


AGGAAGGTAA 


ACGTGCCGTG 


TTATTACTAC 


ATGGTTTTAC 


480 




AGGCAATTCG 


TCTGATGTTC 


GTCAATTAGG 


TCGATTTTTA 


CAAAAGAAAG 


GTTATACATC 


540 




ATAH5CACCG 


CAATATGAAG 


GCCACGCGGC 


ACCACCAGAT 


GAAATACTGA 


AATCTAGTCC 


600 


40 


TTTCGTTTGG 


TTTAAAGATG 


CGTTAGATGG 


TTATGATTAT 


CTTGTTGAAC 


AAGGTTATGA 


660 




TGAAATTGTT 


GTTGCTGGTC 


TATCATTAGG 


TGGGGATTTT 


GCTTTAAAAT 


TAAGCTTAAA 


720 


45 


TAGAGATGTA 


AAGGGTATTG 


TAACGATGTG 


TGCTCCTATG 


GGTGGCAAAA 


CTGAAGGTGC 


780 


CATTTATGAA 


GGLTTTTTAG 


AATATGCACG 


CAATTTTAAA 


AAGTATGAAG 


GTAAAGATCA 


840 




AGAGACTATT 


GATAATGAAA 


TGGATCATTT 


TAAACCAACT 


GAAACTTTAA 


AAGAACTAAG 


900 


50 


TGAAGCATTA 


GATACGATTA 


AAGAGCAAGT 


TGATGAAGTG 


TTGGATCCTA 


TTTTAGTGAT 


960 




TCAAGCAGAA 


AACGACAATA 


TGATTGATCC 


ACAATCCGCA 


AATTATATAT 


ATGACCATGT 


1020 




AGATTCTGAT 


GACAAAAATA 


TCAAGTGGTA 


CAGTGAATCT 


GGACATGTTA 


TTACGATTGA 


1080 
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CCATCAATGA 
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AATCGAAGGG 


GAAGTTAAGT 


CGATTGAGAA 


GCATTCTGTA 


ACTCAAGTTG 


TTGGTACGTA 


1620 


TAGTGAAGCT 


AGACATTTTG 


GCTTTGTTAT 


TCOGGATGAT 


AAACvjxAx 1A 


TGCAAGATAT 


1680 


TTTCATTCCT 


AAAGGTCAAA 


GTTTAGGCGC 


AGTCGATGGT 


CATAAGGTAC 


TTGTACAAAT 


1740 


TACTAAGTAT 


GCTGATGGTT 


CAGATAATCC 


AGAAGGACAT 


ATTTCTGCTA 


TTTTAGGACA 


1800 


TAAAAATGAT 


CCTGGCGTAG 


ATATTTTATC 


TATTATCTAT 


CAACATGGCA 


TAGAAATTGA 


1860 


ATTTCCTGAT 


GAAGTGTTAC 


AAGAAGCTGA 


AGCAGTACCT 


GATCATATTG 


AAAATACTGA 


1920 


AATTAAAGGC 


CGTCATGATT 


TACGTGATGA 


ATTGACAATC 


ACAATTGATG 


GTGCTGATGC 


1980 


TAAAGACTTA 


GATGACGCAA 


TTAGTGTTAA 


AAAGTTAGCG 


AACGGTAATA CGCAATTAAC 


2040 


TGTAAGTATT 


GCTGATGTCA 


GCTATTATGT 


AACAGAAGGT 


TCTGCATTGG 


ATAAAGAGGC 


2100 


ATATGATAGA 


GCGACAAGTG 


TATATCTTGT 


TGACCGTGTA 


ATTCCAATGA 


TTCCACATCG 


2160 


ATTAAGTAAT 


GGTATTTGTT 


CATTGAATCC 


TAATGTTGAT 


CGTTTAACTC 


TAAGCTGTCG 


2220 


CATGGAAATC 


GATGCTAGTG 


GTCGCGTTGT 


TAAACATGAA 


ATTTTTGATA 


GTGTTATACA 


2280 


TTCTGATTAT 


CGAATGACGT 


ATGATG CGGT 


AAATCAGATT 


ATT ACTGAAA 


AGGATCCTAA 


234 0 


CATTCGCGAA 


CAATATAATG 


AAATTACGCC 


TATGCTAGAT 


TTAGCACAAG 


ATTTATCTAA 


** A A A 

240 0 


TCGTTTGATT 


GAAATGAGAA 


AACGACGTGG 


TGAAAlvAiAi 


TTTGATATTA 


GTGAAGCAAA 


*> a c n 


AGTATTAGTT 


AACGAAGACG 




» TVSTTOft ft 
AuAlurx IWiA 


TTAAGACAAC 


GTGGCGAGGG 




TGAACGTCTA 


AX ITaAAlA-Ax 


TTATGTTAAT 


TYir 1 ft ft ft TCI ft ft 


ACAGTTGCTG 


AACATTTTAG 


^ 3 O \J 


TAAGTTAGAT 


GTACCTTTTA 


TTTACCGAGT 


GCATGAGCAA 


C CT AAATCAG 


ATCGCTTAAG 


2640 


ACAATTCTTT 


GATTTTATTA 


CAAACTTTGG 


CATCATGATT 


AAGGGTACTG 


GCGAAGATAT 


2700 


TCATCCAACA 


ACACTTCAAA 


AGGTTCAAGA 


AGAAGTAGAA 


GGTCGACCTG 


AACAAATGGT 


2760 


CATTTCAACA 


ATGATGTTGC 


GTTCAATGCA 


ACAAGCGCAT 


TATGATGATG 


TGAACTTGGG 


2820 


ACATTTTGGC 


TTATCAGCTG 


AATATTATAC 


GCATTTTACA 


TCACCAATTA 


GACGTTATCC 


2880 
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AGAAGTQAAG CGTTGCGAAG ACAAATTGCC 
ACGTCGTGCT ATTGAGQCAG AACGTGATAC 
5 TCAACATATT GGTGATGAAT TTGAAGGTAT 

CATTGAATTG CCAAATACGA TAGAAGGTAT 
TTACCGTTTT GAAGAGCGTC AAATGGCATT 

10 

AATTGGTOAC ACAGTTAAGG TTAAAGTGAC 
TTTTCAAATT GTAGGTATGC CTTTACCGAA 
TAAGACAATT CAAGCCAAAA CG CGTGGTAA 

IS 

GGGTCGTAAG AAAAAAGGTA AGCAACGTAA 
AGGTAATAGT AAGCATAAGC CATTTTATAA 

20 TAAGAAAAAA TAAGCAGCAA TGAGGTGAGT 

ATTAGCGGAA AATCGTAAGG CAAGACATGA 
AATTGTATTG CAAGGCACAG AAATAAAATC 

25 TAGTTATGCG CAAGTTAAAA ACGGTGAAAT 

CGAAGAAGGG AATCGTTTTA ATCACGATCC 
GCGTGAAATC ATTAAATTGG GTGATCAAAC 

30 

AAAGCTTTAT TTGAAGCATG GACATTGTAA 
AAAATATGAT AAACGTCAAG CTTTGAAAGA 

3s TATGAAAGCC CGTTATTAAG CGATTTAGTT 

ATGTGCTTTT GTAAATTACA AAAGTATGAT 
TGGAOTCGAC AGGGGTCCCC CGAGCTCATT 

40 ACACACACAG TTTATAATAA CTGGCAAATC 

GCACTCTGCA TCGCCTAACA GCATTTCCTA 
GATATGCTAA ACACTGCCGT TTGAAGTCTG 

45 

TGTTGGTTGT TTATCACTTT TCATGATGCG 
GATGTGTATC AGGACCTTTG GACG CGGGTT 
ACAGCCTTTG TGGTTGTGGG CTTTTTTATT 

£0 

AATTTGTTGT GAGTATTGAT AT AG CAGTGT 
AGTAATAAGT GATTATGAAT TAGTTTTTGA 

55 
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TGAGTTAGCT GAACATACTT CTAAACGTGA 3000 

TGATGaATTG AAAAAAGCAG AATATATGAT 3060 

TGTCAGCTCA GTAGCTAACT TCGGTATGTT 3120 

GGTTCATATT GCGAATATGA CTGATGATTA 3180 

AATTGGTGAG CGTCAAGCTA AAGTATTTAG 324 0 

GCATGTTGAT GTAGATGAAC GATTAATTGA 33 00 

AAATGATCGA TCACAGCGCC CAGCGCGAGG 3360 

ATCATTAGAT AAATCAAAAT CTGATGATAA 3420 

AGGTAAAAAC CAACGTAATA ATGATAAATC 3480 

AGATAAAAGT GTGAAAAAGA AAGCACGTCG 3540 

ATGAATGGCT AAGAAGAAAT CACCAGGTAC 3600 

TTATAATATT GAAGATACGA TTGAAGCGGG 3660 

AATTCGCCGA GGTAGTGCTA ACCTTAAAGA 3720 

GTATTTGAAT AATATGCATA TAGCACCATA 3780 

TCTTCGTTCT CGAAAATTAT TATTGCACAA 3840 

ACGTGAGATT GGTTATTCGA TTGTGCCGTT 3900 

AGTATTACTT GGTGTtGCAC GAGGTAAGAA 3 960 

AAAAGCAGTC AARCGAGATG TTGCGCGCGA 4 020 

GCTTAATCGG GCTATATTTG ATATAGTTAT 4080 

TTGTTTGATT TATTATTTCG GGGACGTTCA 4140 

AAGCGTGTCG GAGGGTTGTC TTCGTCATCA 4200 

AAACAATAAT TTCGCAGTAG CTGCCTAATC 4260 

TGTGCTGTTA ACGCGATTCA ACCTTAATAG 4320 

TTTAGAAGAA ACTTAATCAA ACTAGCATCA 4380 

AAACCTATCG ATAAACTACA CACGTAGAAA 4440 

CAAATCCCGC CGTCTCCATA TTTGTAGCCT 4500 

TTGTGTTTTT CAGGGGATAA TGCATTGCAG 4560 

TTGTATAGGT GTTTATTTGA TGGAGGAAAG 4620 

GATATAAGGG GACAGTGATG TGTGTCAAAT 4680 
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TTATACGCAA AAAATTCTCC ATGTTATATA TGTCAATATA AAAATGTGAA TCGTCTACAC 4 800 

TTAATTGGAT AAATGGCTAC TGAAAAAGAA CTTTTCATTT TTGTTACGTC ACTAAGTGGG 4860 

TGTAGTTATA AAGAGATGAG CCGAGTTTTG ATATTTTCAT TAGAATCAAT ATGCCTATTA 4920 

ACACAAT CAG CAATAGTTGA CGAGACGGAA ATAAAAGAAG TCGTAGTTAA GAAATGCATT 4980 

TCACAACATA CCATTGTAGC CATTTTTATT GTTTTGGATG ATAAACTCTT TTTGGAATTT 5040 

TTAGTTTTTA TAATTTGCAA CTACACTACT TCTTTTACTA ATATTAATGT CTAAGTAATC 5100 

GATAAAAAAT TTTCCATTGA ATAAATGAGA AGTTAAAAAC TTTACTTAAC CTTTCycATT 5160 

1S GCATTTTCCT ATTCACGATT TTAAGAACCC AACATACTAC AAACGAATTT TAAAAGGCGA 5220 

GAGTAAAGCT TACTTGTTTA TTATACATAT TTAAAATCCA AGAGTCAGAA CAGACTACTC 5280 

CTCTTTATAA CTATAAAAAA TAGCTATGAA AAAATCTATC GTCATAGATT CCTTCATAGC 5340 

20 TAATCTTAGT ATGTTTATTT TTATTTTAGG ATGCTATTTA TCAACTCAAC ATATAACTCA 5400 

CTATTTTTAT AACCTTCTAA TATATCATTA ACTTGTCTAA TAGGTATTTC TGGTACTTCT 5460 

CTAATGTTTT CCAATTTTGT TTTAAATTGT TTTTTTGTTA TTTGCTCTTT ATTTGTAGCC 5520 

AATTGGAACA AGTAAGAATC TAGCATATTA ATTTCTTTAT ATGAATACAT ATATCTTAAT 5580 

AACACTAAAT CTCTAGTTTT TAAGTTAGGC GCTAGTTCTT CTTGTAATTG TTCTATTGAT 5640 

TGTyTCATTA ATAACAATCT CATTTCTAAT TCTTCATTAT TCATTTTATC ACACTCTT t T 5700 

TATATTAATG CTTGACCAAC TTGGGAAACC CAAAACCCTA TGCTTCTTGC AGTAGAATCT 5760 

TTAATACCAG TTCCCATCAA TGCTTGTGAA ACTTGACCTT GTACATTTCC CCATGTAGCC 5820 

TCTTCTTGTT TTAATG CATT ATTCAATGCG GGATTTAGAA ATTTATCCCA TCTTTTTTTT 5880 

ATGATTTTCC GGCACGGGGA CTGATTTCTT TAACACCATT AAACACAGAT TTTTTATTTT 5 940 

TAATCATAGC TTTATAGTAT CATGTTGGCT AAGCTATAAA TAAGTCAGTT TCTCTAAAAA 6000 

TTAAATAACT GAATGTAAGA CAATGAACAA wCCAAATTTA TACTTCATCT AAACCACTGT 6060 

GGTCGTCATC TTTTTGCTTT TCTTTTTCTT TCTCTCGTTC TTGTTCTTTT TTGTACTCTT 6120 

CTTCAAATTC TTTTTCTTTC TTTTCTACTT CTTCTCT 6157 
(2) INFORMATION FOR SEQ ID NO: 185: 

<i) SEQUENCE CHARACTERISTICS ; 

(A) LENGTH: 884 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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CATTTGTTAT TCTGAQTAGC CAATTTGGCA AAGATGAACA AACGTCTGAA CAAACGTATC 
AAGTTGCAGT CX5CATTAGAG TTAATTCATA TGGCAACACT TGTTCATGAT GACGTTATTG 
ATAAAAGCGA CAAGCGTCGA GGCAAGTTAA CCATATCAAA GAAATGGGAT CAGACAACTG 
CTATTTTAAC TGGGAATTTT TTATTGGCAT TAGGACTTGA ACACTTAATG GCCGTTAAAG 
ATAATCGTGT ACATCAATTG ATATCTGAAT CTATCGTTGA TGTTTGTAGA GGGGAACTTT 
TCCAATTTCA AGACCAATTT AACAGTCAAC AGACAATTAT TAATTATTTA CGACGTATCA 
ATCGCAAAAC AGCACTGTTA ATTCAAATAT CAACTGAAGT TGGTGCAATT ACTTCTCAAT 
CTGATAAAGA GACTGTAOGA AAATTGAAAA TGATTGGTCA TTATATAGGT ATGAGCTTCC 
AAATCATTGA TGATGTATTA GACTTCACAA GTACCGAAAA GAAATTAGGT AAGCCGGTCG 
GAAGTGATTT GCTTAATGGT CATATTACGT TACCGATtTT ATTAGAAATG CGTAAAAATC 
CAGACTTCAA ATTGAAAATC GAACAGTTAC GTCGTGATAG TGAACGCAAA GAATTTGAAG 
AATGTATCCA AATCATTAGA AAATCTGACA GCATCGATGA GGCTAAGGCA GTAAGTTCGA 
AGTATTTAAG TAAAGCyTTG AATTTGATTT CyGaGTTACC aGATGGACaT CCGaGAtCAC 
TACyTTTAAG TTTGACGAAA AAAATGGGTT CAAnAAACAC GTAGTATTTA TGllAAAAGTA 
TTGAAAGCGC TTTACCAACC TGTTAATATA TAATAGTAAT ATAC 
(2) INFORMATION FOR SEQ ID NO: 186: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6876 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

- (xi) SEQUENCE DESCRIPTION; SEQ ID NO: 186: 
AATTTCATCT GCTCGTGCAA AATCTTTGTT TTTCCTTGCT TCATTACGCT CTTCGATTAA 
TTTTTCAACA TCTTCATCCA ATAATTCATC TGCATTTTTA GATTTTAACG GTACACCTAA 
AACATCGCTG AAAATTTGAT AAACTGCTTT AAATTTATCA ATTACTTCTG TTGATGTTGT 
GTTCTCTAGT ACATATTTAT TCGCAAGTkT TGCTAAATCA TACCAAGCTG TAATTGCATT 
AGCTGTATTA AAATCATCAT TCATAACTGT TTCAAAACGA TTTAAAATCG CATCAATTTG 
ATCAATATAT GTCTGTTGAT TTTCAATATT AGTAGCAATT TGTGCGCGCT CTTCAATTAA 
TTGATAACTA TTGCGAATAC GCTCTAGTcC aCTACGTGCT GATTCTACCA ATTCTAGATT 
ATAGTTAATT GGGCTTCTAT AATGTACGCT AATCATAAAG AATCTTAGTA CATCTGGATC 
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ATTATCAATA TTAATGAAAC CATTATGCAT CCAATAATTA GCAAATGGCG CATGATTATG 600 

TGCTTCTGAT TGTGCTATTT CATTTTCATG ATGTGGAAAT TGTAAATCTG AACCACCCGC 660 

ATGTATATCA ATTGTAGGTC CTAGCTCATG AAATGCCATT ACAGAACATT CTATATGCCA 720 

TCCTGGTCTA CCTTCACCAA ATGGGCTATC CCAACTAATC TCGCCAGGTt CGCTTTTTTC 780 

CACAATGTAA AATCAAGTGC ATCTTCTTTA TGCTCTCCTG CATCTATACG AGCACCCACT 840 

TTTAAGTCAT CTATGGATTG ATGACTTAAT TTACCATAAC CTTCAAATTT ACGTGTTCTA 900 

AAGTAAACAT CGCCACCACT TTCATATGCA TAACCTTGAT CCACCAAATC TTTAATAAAT 960 

IS TGAATAATGT CATCCATATG GTCCATTACC CTTGGATTTG AAGTCGCTTT TCTAACATTT 1020 

AACGCACCAA CATCTTCATG AAAAGCAGCG ATATATTTTT CTGCAATTTC GGGAACAGAC 1080 

TGATTTAATT CTTGAGAACG TTTAATTAAT TTATCATCTA CGTCTGTAAA ATTTGATACA 1140 

20 TATTCTACAT TAT ATCCTTG GTATTCAAAG TAACGTCTCA CTACGTCATA ATTAATTGCw 1200 

GGTCTTGCGT TACCAATATG AATGTAGTTA TATACAGTAG GACCACATAC ATACATTTTT 1260 

ACTTTCCCTG GTTCTATAGG CTTGAACACT TCTTTTTGAC GTGTAAGCGT ATTATATAAT 1320 

GTAATCATCT TGAATCTCTC CATTCCTAGT CTTTTCAAGT TGTOGTTCTA AATGCTTAAT 1380 

TTGTTCATAA ATTGGATCAG GTAGATGGCG ATGATCAAAT GTTTTTCCAA CTCGAACACC 1440 

ATCTTGCTTA ACAATATGTC CTGGTATACC AACAACCGTT GAATAACTTG GAACTGATTG IS 00 

TAAAACAACT GAATTTGCAC CAATATTTAC ATTTGAATTT ATTTTAATAT TTCCTAAAAC 1560 

TTTCGCACCG GCTGCTATTA AAACATTGTC TCCTATATCT GGGTGTCTTT TCCCTCTTTC 1620 

3$ TTTCCCTGTC CCACCAAGTG TCACGCCTTG ATAGATTGTC ACATTATCAC CAATTGTACA 1680 

TGTTTCTCCT ATTACAACGC CCATACCATG ATCTATAAAT AGACGCTTTC CAATTTTAGC 1740 

ACCTGGATGG ATTTCTATAC CTGTGAAAAA TCTTGAAATT TGAGATATCG CGCGTGCTGC 1800 

40 AACATATTTT TTTTGGTTGT ATAACTTATG TGCAATCAAA TGACTCCAAA CTGCATGTAA i860 

ACCTGCATAC GTTGTAATGA CTTCTAATGT TGAACGTGCC GCTGGATCCT GCTCAAATAC 1920 

CATTTTTATA TCGTCTCTCA TTCTTTTTAA CAAGATCATT TCCTCCTCAA TGATTGAACT 1980 

45 

ACGTAAATAC ATAATTGAAG TACCTGCGAA ATTAAATATC AAAAAAGCAC CACTAACATA 2040 

CAAATTGTAT TGTTAGAGGC GCTTCCGCAC GGTTCCACTC TGAATTTAGC GAATAACATT 2100 

AATAATATTG CGGGCGCTTC CAAATTATCA AGGAAACTAA GTCAACTTAA TGCTCATCAC 2160 

SO 

TCTCATTATA TATTTAATTC ATTTTACGAA GGTGCATTCA TTAATTTCTA CGTTGTACTC 2220 

ACAGCAACCG TACACTCTCT GCATCGTATA AATTTAATTA CTAATCCTTC GTTTTATATA 2280 

55 
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ATAAAATTCA AGTATATACT ACCTTGATCT 
CGGTTTAGCA CTTTTTCTTT AC CAAGTACT 
6 ATTTGGCCTG TTACAGCAAC ACGAATAGGC 

TCTTTTTGAA CTTCTTTAAT TGTCTTTTTA 
TCTAATTTAC TGAATAAGTG CGTCATTAAC 

10 

TGTTCTTCTT CAC CAAGAGC TGGCATTTCT 
TCACCGGCAT AACTCATTTC TTTTTGATAA 

1S TCCTCTTCTG ACGGCACCTC AGGAATCAAA 

TGGAATACTG TTTCAGTATC TTTTTGTTTC 
TGCTTATCGA AAAATGCTGG TGATTTTGAC 

20 TCTTCTTTAG AAAAGATTTC TTCTTCACCT 

TTAAATAACG CTTCAGGTAA ATAACCTAAG 

TGCCCATCAC GTTTACTTAA CTTTTTACGT 

25 

AAACGAGGTG GCTCCCAGCC AAATGCTTCA 

ATATGATCAT CACCACGAAT TACATCTGAA 

GCAAAATTGT ACGTTGGAAT GCCATCTTTT 

30 

GAATCAAATG AAATATTTCC TTTT AC CATA 
ACTCGGAAAC GAATTGATGG TTGGCGTCCT 

3S GTCAAATGCG CATGTTG AC C ACCATAGCGA 

CGTTCAGCTT CTAATTCTTC TTCTGTCATA 
AACKATCTA TTAATGGTTG GTAGATATGT 

40 CCATTGTCTT TATCTACAGA CTCATCCCAA 

TGTGATGTTT CTCCATCTTC TAAATTACGT 

AAATCTCCGT TGTAATGTTT AGCATACAAG 

45 

ATATGAAGAT ACCCAGTTGG ACTTGGTGCA 

TTCACTCCTA AATTAAATAT CAGATTTTCA 

TCTTCGACCG TCATAACAAA TGTCTAACTC 

60 

TAACATGACC TTAAAATAAT TTCATTGTTT 
TTAAATTTTA AATAGAAAGC TGTTGTTTTT 

55 
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TGTCTATTTC ATTACTTATA TTGTTTTAAA 2400 

TCAATTGTAT TTGGTAATTC AGGACCATGC 2460 

ATAAATAATT GCTTGCCTTT TATTCCTGTT 2520 

ATTTCAGCCG CTTCAAATGG TTCAAGTGCT 2580 

TCTGGTACTT GCTCTCCATT AATCACTTGT 2640 

TTAAAGAACA TTTCTGATAA AGGTACAATT 2700 

AGCGCAATTA ATTTGCGTCC CCAAGATAAA 2760 

TTTGCTTTAA TTAAATGAGG TAATGCTAAT 2820 

ATATATTGGT TATTAACCCA TGCTAATTTT 2880 

AAACGCTTTT CATCAAAGAT TTTGATAAAT 2940 

TCAGGAGACC AACCTAATAA CGCAATAAAA 3000 

TCACGATATT GCTCAATAAA TTGTAAAATT 3060 

TCTTCATTAA CAATTAATGA CATATGACCA 3120 

TAAATCATAA TTTGTTTAGG CGTGTTTGAA 3180 

ATTTGCATGT AATGATCATC TATAGCTACT 324 0 

TTTACGATAA CCCAGTCACC AATACCATTT 33 00 

TCATCAAATG AATACGTTTG GTTTTGAGGT 33 60 

TCTGCTTCAA ATTGTTGACG TTGTTCTTCA 3420 

GGCATTTCAC CACGAGCGAT TTGCGCTTCA 3480 

TAGCATTTAT ATGCTTTATC TTCTGCTAGT 3540 

TGACGTTCAG ATTGACGATA TGGTCCGTAG 3600 

TCTAATCCTA ACCATTTAAG ATT AT CAAAT 3660 

TTTTTATCAG TATCTTCAAT TCGAATCACA 3720 

TAATTGAATA ATGCTGTTCT TGCATTACCA 3780 

TATCTTACTC TTATACGATC GCTCATTTTT 3840 

AGTTAGTTCA TATAAATTGT TCATTTGCTA 3900 

GTCTTATTGT TAAAACGAAA CAATGCTTTT 3960 

AATCATAACA TAATTCCCTG GGTAATATGC 4020 

TCAACACTTT AAAAAAGCTA TCCCTAAGAA 4080 
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TTAAACTTCA AATTAACTAT TCAAATACGT TAAAATTGAT TCTAATTTTO TATGTCTTGA 4200 

TTGCTATAAG AATAACTTTA TTAATATCTA AAATTTAACA CTTAATGAAC TTGTTTCAAT 4260 

GATATATTAG CACTATTTGT ATTTTTTGAT AACTAATATG TTTTGCATTT ATTTATAGTT 4320 

ATACTTCAAA TTACAAACTt CGCCATTTCA TATACCTTTT AATATCTATT TTGTTTTCGT 4380 

CAACTACAGT TTTTATAATG ATACTGTATC TTCGATTTTT TTAGCAAAAA CAATTCTTCC 4440 

TGAAGATGTT TGCAATAAGC TGACTACTTC TAAATTGACA TGACTGCCAA TAAGATTTTT 4500 

AGCATTATCA ACAACTACCA TCGTACCATC ATCTAGATAT CCTACTGCCT GACCAGGCtC 4560 

J5 CTTACCCATT TTTGTCAGTA AAATATGCAG TTGATCACCT TGATGTACAT TAGGTTTGAT 4 620 

TGCTTCTGAT AAATCATTAA CATTTAATGC TTTGATACCA TCTACATGAC AAACTTTATT 4680 

TAGGTTGAAA TCTGTCGTTA TAATACTTGC ATGATATTGT TTTGCTAATT TTAATAACAT 4740 

20 CGTATCAATA TCACTATGTG TTTTAGTTGG ATGTATAACC TTTGTAGGAT AGTCTAAATC 4 800 

ATACAATTCA TTTAAAATAT CTAAGCCTCT TTTACCCTTT TCaCGTTTAA CACTGTCATT 4860 

TGAATCTGCA ACAATTTGTA ATTCATTAAT AACACCTTGT GGAATTAAAA TATTGCCATC 4 920 

25 

GATAAAACCG CAACGAATGA CTTCTAAAAT ACGACGATCA ATAATTGOGC TTGTGTCGAT 4 9 BO 

AATTTTTGGC GTAgcaCTTT TaGTATGTTG TGACATGGAA CGCGCTATAT TCTCAGGTAA 5040 

AAACATTAAC ATTTCATCTC GTTTTTTAAG GCCAAATTGG AAACCGAAAT AACATAGTAA 5100 

30 

TATCGTAATT ATGACAGGAA TGAAATGATT AAAAATAGAG TTGCCAATTG ATTCTAATAT 5160 

AAACGACACC ATAACAGAAA TAAGTAATCC GATTATTAAA CCTATTGTTG CGAATAGTAT 5220 

TTCAACAGCA CTTCTACGCA TAATAAAATG TTCTAAACCT TTTATAGCGT TAGTAACTCG 5280 

TCTAATAAAT ACACCAAAAA TTAAGAACAT AAAAATACTA CCGATAATGC CATCTACATA 5340 

GTGATTTTTT AAAAAGCTGG AGTTTTGTAA TCCAAGATCA TTTGCAATTT CAGGAATAAT 5400 

AATTATTCCT AATGCGCTCC CAATAATTAA GTAAATAATA ATAACCATTA GTTTAACGAT 5460 

ATTCACACAA TGTCCTCCTT TCTTGATGTT TTATGAATGA AGAGCAAATG ACAATACTTC 5520 

ATGTACAGTA GTTACACCTA TTACTTGTAT ACCTTCAGGA TATGTCCATC CGCCTATATT 5580 

ATTTTTAGGA ATAATTACAC GTTTGAAACC TAGTTTTGCA GCCTCTTGCA CGCGTTGTTC 5640 

TATCCGAGAT ACACGACGTA CCTCACCOGT TAAACCAACT TCTCCAATAT AGCAATCTAA 5700 

TCCGTCGACA GCTTTATCTT TAAAGCTAGA TGCAGTTGCT ACAATTACAC TTAAATCAAC 5760 

TGCTGGCTCC GTTAACTTTA CACCGCCAGC TACTTTGATA TAAGCATCTT GTTGTTGTAA 5820 

TAGATAATTT TCTTTCTTTT CCAAAACAGC CATCAACAAA CTTAATCGAT TATGATCAAT 5880 
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TATTAAAAGT GGTCTGGTTC CCTCCATGGT TGCAACAATT GTTGAACCTG GAACATTTGT 6000 

TGAACGTTCT TCTAAAAACA TTTCAGATGO ATTATTTACA CCTTTTAATC CACTTTGCTT 6060 

5 

CATTTCGAAG ATTCcCATTT CATTCGTTGA ACCAAAACGG TTTTTAACAG CTCGCAAAAT 6120 

TCGATATGCG TGGTGTTCAT CGCCTTCAAA ATAAAGCACA GTATCaACCA TGTGTTCTAG 6180 

CAATCTTGGG cCCAGCAATT TGACCTTCTT TCGTTACATG ACCCACTATA AAAGTTGCaA 6240 

10 

TGTTCATTTG TTTAGCAATA TTCATTAAAC TTTGTGTACT TTCACGAACT TGTGAAACAG €300 

AACCTGGCGC AGAGCTGATT TCAGGATGAT ATATTGTTTG AATCGAATCC ACTACTAATA 6360 

,5 AATCAGGTTG TTCTTCTTTT ACTGTTTGAT AAATAACTTC AAGATCTGTT TCAGCTAATA 6420 

CTTGCAATTC ACTTGAATCT TCATCTAATC GCTCTGCACG TAATTTAGTC TGACTAAGCG 6480 

ATTCTTCTCC AGTAATATAT AGTACTTTTT TCTTTTGAGA TAACGATGCA CAAATTTGTA 6540 

20 AAAGTAACGT TGACTTACCA ATACCTGGAT CCCCACCAAT AAGTACTAAC GATCCGCTCA 6600 

CAATACCTCC ACCTAATACA CGGTTGAATT CTGCTGAATC TGTTAACACT CTCGGCGTTG 6660 

TTTCATGTTT AATACTATTT AATTTTTGTA CTTTACCTGC TAATTCCTTG GTTTTAACTC 6720 

25 

CATGTTTAGG ATTGGCTGCT TTTTCAACAA TTTCCTCCAT TTGATTCCAA GCGCCACAAT 6780 
TAGGACATTT CCCCATCCAT TTAGGAGATT GATAACCACA AGCCATACAT TCAAAAATCA 6840 
CTTTTTTCTT GGCCArAATT GCAcCTCCAC TTTCTT 6876 

30 

(2) INFORMATION FOR SEQ ID NO: 187: 

\( i), , SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1193 base pairs 
3S (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 187: 



SO 



CAACTCAAAC 


AGCAGAACAA 


CGTCGTGAGT 


TGATTAATGG 


TGTATTTACT 


GACATTAATC 


60 


CCATACATTA 


AAAATATGAT 


GTACGTGTTA 


GCAGATAATA GACATATCTC 


ATTAATAGCT 


120 


GACGTATTCA 


AGGCGTTCCA 


AAGCTTATAT 


AACGGACACT 


ACAATCAAGA 


TTTTGCAACA 


180 


ATTGAGTCAA 


CATATGAATT 


GAGTCAAGAA 


GAGTTAGATA 


AGATTGTCAA 


ACTAGTAACT 


240 


CAACAAACGA AGTTATCTAA AGTTATTGTA 


GATACAAAAA 


TTAATCCAGA 


TTTAATTGGT 


300 


GGATTTAGAG 


TTAAAGTCGG 


CACAACTGTA 


TTAGATGGTA 


GTGTTAGAAA 


TGATCTTGTC 


360 


CAATTACAAA 


GAAAATTTAG 


AAGAGTTAAT 


TAATTATAAA 


GAGGAGTGAC 


ATAGATGGCC 


420 
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x\sA.xvv 1 AUU 


TACTGTATTA 


ft ft ft TT1T2/'iT^f *<1 




ATTAATTCAC 


540 


/■^O ft »l»t«7S ft ft 




lwlvsAuV, In 




ATAACGGCGT 


ACTTGGTTTA 


600 


f*f*f+f*H A ft ft 

GCCCAAAAv-A, 


1 xviAAtiAvJ lAj 






t Ann AC CAT A 


CACAGGTATT 


660 


ACTGAAGGTG 


ft ^"V» ft ft f'Miwit j\ » 

ACGAAU* i. 1 AA 


ACGTACTGGT 


/"V5T 1 ft TP TV TVT/^ 




AGGTGAAGAA 


720 


CTAATCGGAA 


GAGTTGTTAA 


rrV^ft fwn««/^ ft 

TC CATT AGGA 


L-AAU C 1 A I X\» 




APrOATTAAC" 


780 


ACAAXjTAAAA 


CACGTCCaGT 


AGAGAAAAAA 


GCTACTGGTG 








GATGAGCCAT 


TACAAACAGG 


TATCaAAGCA 


ATTGATGCTT 




X\7V^ inUHw X 




CAACGTGAGT 


TAATCATCGG 


TGACCGTCAA 


ACAGGTaaAA 


CAACAATTGC 


AATTGACACA 


960 


ATTTTQAACC 


aaaaagatca 


AGGTACGATT 


TGTATCTATG 


TTGCTATTGG 


TCAAAAAGAT 


1020 


TCAACAGTAA 


GAGCAAATGT 


TGAAAAGTTA 


agacaagcag 


GCGCTTTAGA 


CTACACTATT 


1080 


GTTGTAGCAG 


CATCAGCTTC 


TGAACCTTCT 


CCATTATTAT 


ATATTGCACC 


ATATTCAGGT 


1140 


GTAACAATGG 


GTGAAGAATT 


CATGTTTAAC 


GGTAAACATG 


TTTTAATCGT 


TTA 


1193 



(2) INFORMATION FOR SEQ ID NO: 188: 

25 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 554 9 base pairs 

(B) TYPE: nucleic acid 
(C> STRAND EDNESS : double 
(D) TOPOLOGY: linear 

30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 188: 



3S 



40 



SO 



TGCTAAGAAG 


TCAAAATAAA 


CTAACTATnA 


AACATCTAGT 


ACGATTATTA 


AAGTGACAGA 


60 


TnATAAAATT 


GAATTATTnA 


GAGAAGGAGA 


TATAAAGTTT 


GAAGAAATAA 


AAGAAAGACT 


120 


AGGTACAGGT 


ATTATTTATG 


AATAAGTTAA 


TACTTGGGAT 


TTATTTATAC 


CGAATTTTTT 


180 


CACGAGCATA 


CTTTTATTTA 


CCGTTTTTAT 


TAATTTACTT 


TTTGATTCAA 


GGTTATTCCA 


240 


TAATACAATT 


AGAAATATTA 


ATGGCGTCTT 


ATGGCATTGC 


AGCATTTTTA 


TTCTCTCTAT 


300 


ACAAAGAGAA 


GTGTTTTAAA 


ATTTGTAACT 


TAAAAGATTC 


TAATAAATTA 


GTTGTTAGTG 


360 


AAATATTCAA 


AATCATCGGT 


TTATTGTTGT 


TATTATATCA AAATCAATAT 


TTAATTTTAG 


420 


TAGTGGCACA 


AATATTATTA 


GGGTTAAGTT 


ACTCAATGAT 


GGCGGGTGTT 


GATACCGCAA 


480 


TAATTAAAAG 


AAATATAACA AATGAGAAAT 


ACGTACAAAA 


TAAGTCAAAT 


AGCTATATGT 


540 


TCCTATCATT 


ATTAATTTCA 


GGGATTATAG 


GTAGTTATCT 


TTATGGAATA 


AATATTAAAT 


600 


GGCCTATAAT 


AATGACTGGT 


ATATTTTCAA 


TTCTAACAAT 


TATAATTATT 


CGATGCACAT 


660 
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10 



TACCAGAAGA GAAGTTTTGG ATATTGCATT ATTCTTTTTT AAGAGCGTTA ATATTAGGAT 780 

TTTTTATAGG ATTTATTCCA ATTAATATAT ATAATGATTT AAAACTGAAT AATTTACAAT 840 

TTATTTCAGT ATTAACTTGT TACACAGTTA TGGGTTTTGT ATCTTCACGT TATTTAACTA 900 

AATACTTGAA TTATAAGTTT GTGTCAGAAA TTTGTTTAGT AATATTTTTA ATAATATATA 960 

CATATCAAAG TTTCATAGCA GTTACTATTT CTATGATATT TTTAGGTATT TCTTCAGGGT 1020 

TAACTCGTCC ACAAACTATA AATAAACTTT CTAGCAGTAG TAACTTAAGA GTGATGCTTA 1080 

ATTATGCAGA AACGTTATAT TTTATTTTTA ATATCGCATT TTTACTTATG GGTGGTTACT 1140 

15 TATATACAAT AGGAACTATT CAATACTTAA TATTATTTAT TTCGTTATTA ATTTTTATAT 1200 

ATTTAATAAT AATATTTyAT TTTACAAGGA GAGAGCAACA TGAAAATAAA AACTGAATTT 1260 

AAAGGGAACA ATATACCATA TGAATACGCA GCAGGTGCAG ATGTGAGTGA TTCTATTAAC 1320 

GGGAATCCAA TTAAGTCATT TCCATTTGAA GTAATTGAAT TACCGGAAGG gACTAAATAT 1380 

CTTGCTTGGT CTTTAATTGA CTATGATGCA ATTCCTGTAT GTGGCTTTGC TTGGATTCAT 1440 

TGGAGTGTAG CTAATGTAAG TGTTAGTGGC AATTCAATTT CTATAAAAGC AGATTTATCA 1500 

AGAACAAAGG GCGACTATGT ACAAGGTAAA AATAGCTTTA CTAGTGGGTT GTTGGCTGAA 1560 

GATTTTTCAG AAATAGAAAA TCACTATGTA GGACCTACAC CACCTGATCA AGATCATCAA 1620 

TATGAATTAA CAGTTTATGC GTTAGATCAT TCTTTAAATT TGAAGAATGG GTTCTACTTG 16 BO 

AATGAATTTT TAAAAGAAGT AAATCAACAT AAAATTGATC AAACAAGTAT TAACCTTATA 1740 

GGAAGAAAAA TTTAATACTA AATATCTCAT CAATATAAAA TTGTTCAATT AAAAGTACAA 1800 

AGAAACAAAG GTTTTAATTT ATATATTAGG TACGGCGTTC GCTATAATGC AAAGAAGTAA 1860 

TTAAATTTAA GAAATGTAAA CTTAGTTATT GTAATGTGAA TTTATTTGAA AAAATAGAAA 1920 

GTATTAACAA TTATAGCTTT TACATTAATT AAAATTTATT TTTAAAAACA AGTAAACAAT 1980 

TTACATACTT ATAATTTTTG AAAATTTTCA ATTTGTGTTA TATTGATTTT GTAAGATACT 2040 

TTAACTCACA AAGGAGAGAG AGTATATGAA ATTAAAATCA TTTATAACTG TAACTTTGGC 2100 

ACTGGGCATG ATCGCAACGA CTGGCGCTAC TGTGGCAGGT AATGAGGTAT CTGCAGCAGA 2160 

AAAGGACAAA CTACCGGCAA CTCAAAAAGC TAAAGAAATG CAAAATGTTC CATATACAAT 2220 

TG CAGTAG AT GGCATTATGG CTTTCAATCA ATCTTACTTA AATTTACCAA AAGATAGCCA 2280 

ATTATCATAT TTAGATTTAG GAAATAAAGT TAAAGCTTTG TTATATGATG AACGCGGTGT 2340 

AACACCTGAG AAGATTCGAA ATGCAAAATC TGCCGTTTAC ACGATTACTT GGAAAGATGG 2400 

TAGTAAAAAA GAAGTGGATC TTAAGAAAGA TAGCTACACA GCAAACTTGT TTGATTCAAA 2460 



20 



25 



30 



35 



45 



SO 



55 
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CAACATGAAG CATTTAATTT TACAGTGATG ATTATAAAAT AATTGCCTTG ATACAAAGAT 2580 

TACTCGTAAA TQACATCTTT GTATTAAGGC TTTTTCTAAA TTTAAAAGTG ATGGGTTAGA 2640 

GGTCATTGAG CTTTAAAATA TTCAAAATAC AAAACATTAA TGGCCAAAAA TAAAAGCC6C 2700 

CTTTATCTGG GCAGCTTCAA TAATAAGAAA GACATATTTC ATTTTATACT AAATAGTTAT 2760 

TGTGATGAAT CTTTCGGCGG TTTAATTACT GCAGCAAAAA TTGCTGTGAA AATCGTGAAC 2 820 

AATACTGCCA TGATAATTGG ATTCACTACA TTTAAGCTGT CTCCACCTAC TAGGCTATTA 2880 

AGTACAAAGT TAACCATTTG CATTAATAAT AATGCCCAAA AGAATGTTAC GAGGTGTTTC 2940 

ATGTCATTCT ACCTCCACTT TAATTATATA TATTTTATTT TAAGTGAAAG TTAGAAATTT 3000 

GTATAGTAAC ATCTCATATA TTTTGACCAT ATTATACAGT TTAAATAAAT GATTTTATCT 3060 

GAATGGCTAT TCTAAATTAA GCGCATTAAA ACCAATTTCA TACTGAAATT TGACGATAAT 3120 

20 AAAGCATTAA AATTTTATTA ACTAGTCAAT ATTCCTACCT CTGACTTGAG TTTAAAAAGT 3180 

AATCTATGTT AAATTAATAC CTGGTATTAA AAATTTTATT AAGAAGGTGT TCAACTATGA 3240 

ACGTGGGTAT TAAAGGTTTT GGTGCATATG CGCCAGAAAA GATTATTGAC AATGCCTATT 3300 

25 TTGAGCAATT TTTAGATACA TCTGATGAAT GGATTTCTAA GATGACTGGA ATTAAAGAAA 3360 

GACATTGGGC AGATGATGAT CAAGATACTT CAGATTTAGC ATATGAAGCA AGTTTAAAAG 3420 

CAATCGCTGA OGCTGGTATT CAGCCCGAAG ATATAGATAT GATAATTGTT GCCACAGCAa 3480 

30 

CTGGaGATAT GCCATTTCCA ACTGTCGCAA ATATGTTGCA AGAACGTTTA GGGACGGGCA 354 0 

AAGTTGCCTC TATGGATCAA CTTGCAGCAT GTTCTGGATT TATGTATTCA ATGATTACAG 3600 

CTAAACAATA TGTTCAATCT GGAGATTATC ATAACATTTT AGTTGTCGGT GCAGATAAAT 3660 

35 

TATCTAAAAT AACAGATTTA ACTGACCGTT CTACTGCAGT TCTATTTGGA GATGGTGCAG 3720 

GTGCGGTTAT CATCGGTGAA GTTTCAGATG GCAGAGGTAT TATAAGTTAT GAAATGGGTT 3780 

40 CTGATGGCAC AGGTGGTAAA CATTTATATT TAGATAAAGA TACTGGTAAA CTGAAAATGA 3840 

ATGGTCGAGA AGTATTTAAA TTTGCTGTTA GAATTATGGG TGATGCATCA ACACGTGTAG 3900 

TTGAAAAAGC GAATTTAACA TCAGATGATA TAGATTTATT TATTCCTCAT CAAGCTAAXA 3960 

45 TTAGAATTAT GGAATCAGCT AGAGAACGCT TAGGTATTTC AAAAGACAAA ATGAGTGTTT 4020 

CTGTAAATAA ATATGGAAAT ACTTCAGCTG CGTCAATACC TTTAAGTATC GATCAAGAAT 4080 

TAAAAAATGG TAAAATCAAA GATGATGATA CAATTGTTCT TGTCGGATTC GOTGGCGGCC 4140 

50 

TAACTTGGGG CGCAATGAGA ATAAAATGGG GAAAATAGGA GGATAACGAA TGAGTCAAAA 4200 

TAAAAGAGTA GTTATTACAG GTATGGGAGC CCTTTCTCCA ATCGGTAATG ATGTCAAAAC 4260 
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w 



TGAACCTTAT AGCGTTCACT TAGCAGOAGA ACTTAAAAAC TTTAATATTG AAGATCATAT 43 80 

CGACAAAAAA GAAGCGCGTC GTATGGATAG ATTTACTCAA TATQCAATTG TAGCAGCTAG 444 0 

AGAGGCTGTT AAAGATGCGC AATTAGATAT CAATGAAAAT ACTGCAGATC GAATCGGTGT 4500 

ATGGATTGGT TCTGGTATCG GTGGTATGGA AACATTTGAA ATTGCACATA AACAATTAAT 4 560 

GGATAAAGGC CCAAGACGTG TGAGTCCATT TTTCGTACCA ATGTTAATTC CTGATATGGC 4620 

AACTGGGCAA GTATCAATTG ACTTAGGTGC AAAAGGACCA AATGGTGCAA CAGTTACAGC 4680 

ATGTGCAACA GGTACAAATT CAATCGGAGA AGCATTTAAA ATTGTGCAAC GCGGTGATGC 4740 

T5 AGATGCAATG ATTACTGGTG GTACAGAAGC ACCAATTAGT CATATGGCAA TTGCTGGTTT 4 800 

CAGTGCAAGT OGAGCGCTTT CTACAAATGA TGACATTGAA ACAGCATGTC GTCCATTCCA 4860 

AGAAGGTAGA GATGGTTTTG TTATGGGTOA AGGTGCTGGT ATTTTAGTAA TTGAATCTTT 4920 

20 AGAATCAGCA CAAGCTCGAG GTGCCAATAT TTATGCTGAG ATAGTTGGCT ATGGTACTAC 4980 

AGGTGATGCT TATCATATTA CAGCGCCAGC TCCAGAAGGT GAAGGTGGTT CTAGAGCAAT 5040 

GCAAGCAGCT ATGGATGATG CTGGTATTGA ACCTAAAGAT GTACAATACT TAAATGCCCA 5100 

2S 

TGGTACAAGT ACTCCTGTTG GTGACTTAAA TGAAGTTAAA GCTATTAAAA ATACATTTGG 5160 

TGAAGCAGCT AAACACTTAA AAGTTAGCTC AACAAAATCA ATGACTGGTC ACTTACTTGG 5220 

TGCAACAGGT GGAATTGAAG CAATCTTCTC AGCGCTTTCA ATTAAAGACT CTAAAGTCGC 52 80 

30 

ACCGACAATT CATGCGGTAA CACCAGATCC AGAATGTGAT TTGGATATTG TTCCAAATGA 5340 

AGCGCAAGAC CTTGATATTA CTTATGCAAT GAGTAATAGC TTAGGATTCG GTGGACATAA 5400 

35 CGCAGTATTA GTATTCAAGA AATTTGAAGC ATAACTATAA nAATCTTCAG TAACGTTGTT 5460 

TTAGTTACTG AAGATTTTTT CaGTTTCTTT ATACTAAGAT GAGCGACAcA CAATCGTCAT 5520 

AATAAAATAT GAATATTTAT TAATAATAA 5549 

40 (2) INFORMATION FOR SEQ ID NO: 189: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4832 base pairs 

(B) TYPE: nucleic acid 
4S (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



ss 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 189: 
AGATTATAGT AAGATTGATA GTTTGGCGAC TGaAGCgCGa GaAAAATTAT CAGaAGTAAA 60 
mCCTTTAAAT ATTGCACAAG CTTCTAGAAT ATCAGGGGTA AATCCAGCAG ACATATCTAT 120 
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TGGTTAGCAG AACAATTAAA AOAACATAAT ATTCAATTAA CTGAGACTCA AAAACAACAG 240 

TTTCAAACAT ATTATCGTTT ACTTGTTGAA TGGAATGAAA AGATGAATTT GACAAGTATT 300 

5 

ACAGATGAAC ACGATGTATA TTTGAAACAT TTTTATGATT CCATTGCACC TAGTTTTTAT 360 

TTTGATTTTA ATCAGCCTAT AAGTATATGT GATGTAGGCG CTGOAOCTGG TTTTCCAAGT 420 

ATTCCGTTAA AAATAATGTT TCOGCAGTTA AAAGTGACGA TTGTTGATTC ATTAAATAAG 4 80 

10 

CGTATTCAAT TTTTAAACCA TTTAGCGTCA GAATTACAAT TACAGGATGT CAGCTTTATA 540 

CACGATAGAG CAGAAACATT TGGTAAGGGT GTCTACAGGG AGTCTTATGA TGTTGTTACT 600 

15 GCAAGAGCAg TAGCTAGATT ATCCGTGTTA AGTGAATTGT GTTTACCGCT AGTTAAAAAA 660 

GGTGGACAGT TTGTTGCATT AAAATCTTCA AAAGGTGAAG AAGAATTAGA AGAAGCAAAA 720 

TTTGCAATTA GTGTGTTAGG TGGTAATGTT ACAGAAACAC ATACCTTTGA ATTGCCAOAA 780 

20 GATGCTGGAG AGCGCCAGAT GTTCATTATT GATAAAAAAA GACAGACGCC GAAAAAGTAT 840 

CCAAGAAAAC CAGGGACGCC TAATAAGACT CCTTTACTTG AAAAATAATG CATAATCCTT 900 

TACAACTAAC ATAAAAGGAG CGAATGGATA ATGAAAAAAC CTTTTTCAAA ATTATTTGGT 960 

25 

TTGAAAAACA AAGATGACAT CATTGGACAT ATTGAAGAAG ATCGCAATAG TAATGTTGAA 1020 

TCCATTCAAA TTGAAOGTAT CGTTCCCAAC CGTTATCAAC CAAGACAGGT GTTTGAACCA 1080 

AATAAAATTA AAGAACTTGC TGAATCAATA CATGAACATG GTTTACTACA ACCTATTGTT 1140 

30 

GTAAGACCGA TTGAAGAAGA TATGTTTGAA ATTATTGCTG GAGAGCGCCG ATTTAGAGCA 1200 

ATACAATCAC TAAATTTACC TCAAGCAGAC GTTATTATTC GTGAT ATGGA TG ATGAAGAG 1260 

35 ACGGCTGTTG TTGCATTAAT TGAGAATATT CAAAGAGAAA ATTTGTCTGT TGTTGAAGAA 1320 

GCGGAAGCCT ATAAGAAATT ATTGGAAATT GGTGATACAA CGCAAAGTGA ATTGGCAAAA 13 80 

AGTTTAGGTA AAAGTCAAAG CTTTATTGCA AATAAGTTGC GTTTATTGAA GTTGGCGCCG 144 0 

40 AAAGTACTAC TTCGCTTAAG AGAAGGTAAA ATTACTGAAC GTCATGCGAG AgcGGtATTA 1500 

TCATTGTCTG ATAGCGAACA AGAAGCGTTG ATTGAGCAAG TCATTGCACA AAAGCTAAAT 1560 

GTGAAcAGAc TGAAGATAGA GTACGCCAAA AAACGGGGCC CGAAAAAGTC AAAGCACAAA 1620 

45 

ACCTTCGCTT TGCACAAGAT GTCACTCAAG CACGAGATGA GGTAGGCAAA AGTATCCAAG 1680 

CGATTCAACA AACAGGATTA CATGTTGAGC ATAAAGACAA AGATCATGAA GATTATTATG 1740 

AAATAAAAAT TCGAATATAT AAACGTTaGT AGTAGGATGT CGTATACATG ATGACTAACA 1800 

50 

CATAAAAGAC AAAGCTAAGA TCATAACAGC TTTGTCTTTT TTTTTTGTTT TACGTGAAAC I860 

ATAAAAATTT ATATTTATAT GTTGATCAGG CTGGTACATA AATCAATGTT CTATGCTCTA 1920 
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TTCTAGTCAA CCTTGCTGGO GTGGGACGAC GAAATAAATT TTGCGAAAAT ATCATTTCTG 2040 

TCCCACTCCC TAATTTGAGC TGGATATACT TTCATTTGAA CCCTTTATTG CTAGTTTATG 2100 

5 AAAGTATCAT GAAAGCTTTA TGAACATCGC TTGAGTTGCC TTTACAGTAG AAAATTTAAG 2160 

TTTTACACTT TGTGTGAATG ATACGTTTTG TATTGAATTA ATTATAGAAA GGTACGTTGA 2220 

AGATGTTTTC AATTGGAAGT GCAATTCTTC ATTTTGTCAT TGGTGGTATC GCTGTTGCAT 2280 

10 

TAGCTTCAAT TATTGCTGAT AAGGTAGGTG GTAAGTTAGG AGGTATTATA GCTACTATGC 2340 

CGGCAGTCTT TCTTGCGGCT ATTATCGCAT TAGCTTTAGA TCATCGTGGT ACGCAATTAG 2400 

TGGAGATGTC GATGAATCTT AGTACTGGAG CAATTGTCGG TATTCTGTCT TGTATATTAA 2460 

15 

CTGTATTTTT GACATCTCTC TACATTAAGC ATAAAGGTTA TCGGAAAGGC GCAATATTCA 2520 

CAGTTGTTTG TTGGTTTGTC ATTTCCCTCG CAATATTCAG TATTAGACAT TTATAGTTTG 2580 

20 GAAAATGCGT GATAATTAGT TGTATTCAGT TATTAAGTAA TAAATTATTG GAGGCAGAAC 2640 

ATCATGAAAT TAACATTAAT GAAATTTTTT GTGGGGGGAT TTGCAGTATT ATTAAGTTAT 2700 

ATTGTATCTG TAACACTACC TTGGAAAGAA TTTGGCGGTA TATTTGCaAC GTTTCCGGCA 2760 

2S GTATTTTTAG TGTCTATGTT TATTACAGGT ATGCAATATG GTGATAAAGT CGCTGTGCAT 2820 

GTAAGTCGTG GCGCAGTGTT TGGTATGACA GGGGTATTAG TTTGTATTTT AGTTACATGG 2880 

ATGATGTTAC ATATGACGCA CATGTGGTTG ATTAGCATTG TTGTTGGTTT CCTAAGCTGG 2940 

30 

TTCATCAGTG CAGTATGTAT TTTTGAAGCG GTAGAATTTA TAGCACAAAA AAGATTAGAA 3 000 

AAGGATAGTT GGAAAGCTGG AAAATOGAAT AGTAAATAGT GTGAACGTAA TCTCTTAACT 3060 

AGGACTAACT TTGCAAGCAT TGAATAGCAT GGAAAAGTTG CATCATTAAT AAGTGAAATT 3120 

3S 

CAAGTTGGCA TTGAGAAAAT TACAAGCGCG TAATCATACa GGTCTGTCTT AAGGGAGTCT 3180 

TCGAACCCCG ATGTTGTCGT ATGTCAAAAC ATTTAGTCAA TCATAAAGGT GACTTGATTT 3240 

AACTTTATCT GATAGTCTGA TTGTAATGAT TGTACTAATT GACTGGAGGC GTATGTAATT 3300 

AO 

GAATCTGAGT AAACAAATTA AAAAGTATAG GGAACGAGAT GGTTATTCAC AAGAATATCT 3360 

TGCTGAAAAG TTATATGTAT CTAGGCAGAG TATTTCTAAT TGGGAAAATG ACAAAAGCTT 3420 

45 ACCAGACATA CATAACTTAT TAATGAyGTG TGAATTGTTC AATGTAACTT TAGATGATTT 3480 

AGTAAAAGGG ACCATTC CAT TTGTACCTGA TATTAAAGCG CAACGAAGTC TTAACTTATG 3540 

OACATATGTG ATGCTTATTT TCATGACATT AGCTGCAATT TTAATGGGAC CTTTAGTTGT 3600 

so 

TTATTGGAAT TGGACTTGGG GTGTAACGGT GGCAATCATT TTGGGAATAG GTTTTTATGC 3660 

ATCTATGAAA ATAGAAGATT TAAAAAAAGT GCATAAAATG GACAACTACG ATCGAATTGT 3720 
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30 



GACAAATGCG 


CTTTCTATTA 


TATCAGTAAT 


TGGTATACTC 


AGCCTCATAA 


TTTTCCTTAG 


3840 


TGTCTATTTG 


GCAAATAAGT 


TTTTATAAAT 


CATCGTGGTA 


TCGTCTCATA 


TTATTTATAT 


3900 


TATCCAAAAT 


AGCATAAAAA 


AATACCAACA 


AGATTTAGAA 


CCTTGTTGGT 


AATCAAAGCG 


3960 


aTTCATTTAT 


AATGAGTCGT 


TTTATGTTGT 


AAGATTAAAC 


AGTTTGTACG 


TTAACTGCTT 


4020 


GGTCTCCACG 


TTGACCTTCA 


GTGATTTCGA 


AAGTAACTTT 


TTGACCTTCT 


TCTAAAGTTT 


4080 


TGTAGCCATC 


GCTAGCGATA 


CCTGAGAAAT 


GTACGAATAC 


GTCTCCGCCA 


TTTTCTTGTT 


4140 


CGATGAAACC 


AAAACCTTTT 


TCTGCrTTAA 


ACCATTTwAC 


TGTACCGTTA 


TTCATATwGA 


4200 


AwACCTCCGT 


gTGCTTTTGC ACTTAATATT 


TGTAACAAAT 


TCATAACTAA 


AAAAGAGGAT 


4260 


ATTCTAAACA 


AATACACTAC 


AATTTAATTC 


ACGAGCTTTT 


ATTACGTAAG 


ACCAACTATA 


4320 


CGCTCATATT 


GGCATAATGT 


ACAGTX3TTTT 


TTGAAAATAA 


ATTAAAAAAG 


ATTTTTAAAA 


4380 


ACCTTAGAAA 


CGTTGATTTA 


AAGGGGTTTA 


TAAAAATwAw 


AAAATTGTAG 


TCTTTTATGG 


4440 


TGTTTGCTAG 


TTTTCAAAGT 


GACATATCGT 


TTAAACATGA 


TGATTTTATA 


AGCAATCCAT 


4500 


AAAAAACAAG 


CAGCGATAAA 


CGCTACTTGT 


TGATATTAAA 


ATCTGACTTG 


AAAGGTCATA 


4560 


GCAATGTTCT 


ATACCGATGG 


AATGTGCTTA 


CTTGCCTTTT 


TCTTCACGAC 


GTTTTAAATA 


4620 


ATAAGAGCCA 


CCTAATAAAC 


CAGCTGGAAT 


GCCTATCATT GGTGTTGTGA 


ATGAGCTTAA 


4680 


TACAATAACA 


AGTATTGTTA 


AAGCAATGAC 


GTTATACCAA 


GTTACAGTCA 


AATTTTTCAA 


4740 


ATCCTCATAT 


GATTGTTTTA 


CTAATTCTCT 


AAATTTCATG 


ATTCAATCTC 


TCCTTTTTTA 


4800 


TAAATCTTTA 


GATTGTCAAA 


TTAAGCTGGA 


CA 






4832 



(2) INFORMATION FOR SEQ ID NO: 190: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5727 base pairs * 
r (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(XX) SEQUENCE DESCRIPTION: SEQ ID NO: 190: 



45 



50 



CAAAGCTGTT 


CAAAAGGCTT 


ATAATTTAAA 


TTTAGATAAC 


ATACGTACAA 


TGGAACCTAA 


60 


GTTGAGATAT 


CAAGCGATCA 


ATAAAGGTAA 


TATTAATTTA 


ATAGATGCAT 


ATTCAACTGA 


120 


CGCTGAATTA 


AAACAATATG 


ATATGGTTGT 


GTTAAAAGAT 


GATAAGCACG 


TATTTCCACC 


180 


ATATCAAGGA 


GCACCATTAT 


TTAAAGAAAG 


CTTTTTAAAG 


AAACATCCAG 


AAATTAAGAA 


240 


ACCGTTAAAC 


AAACTAGAAA 


ACAAAATATC 


TGATGAAGAT 


ATGCAAATGA 


TGAACTATAA 


300 
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GTTAATCAAA TAACGACCAA CGCCACATAA GATGCGTAAC ACCAAATTAT ATCTTATGTO 42 0 

GCGTTGTTAT ATTTAAATCT ATAATTATGT TCAATTTAAA CATGCAATAA TGATTAAAAA 48 0 

ATATGACATG TTAAACACAA TGTAAGCTAT TATGATGTGA AAATAGTAGC ATTGCATTTT 54 0 

AGAAACATAG AGCGATATAA TGAATATAAG TTTTTTGAAA TTTCAGTTAA TTCTAAGGAG 600 

GTTGTTTTTA TTATGAAAGA ACAACTTAAT CAACTATCAG CATATCAGCC TGGTTTATCT 660 

CCAAGGgCAT TGAAAGAAAA GTATGGCATT GAAGGAGATT TATATAAACT TGCATCAAAT 72 0 

GAAAATTTGT ATGGACCATC GCCTAAAGTT AAAGAAGCGA TATCAGCACA CTTAGATGAG 78 0 

TTATATTATT ATCCTGAAAC AGGATCACCG ACATTAAAAG CGGCGATTAG TAAACATTTA 84 0 

AATGTAGATC AATCACGCAT TTTATTTGGT GCGGGATTAG ATGAAGTTAT ATTAATGATT 900 

TCTAGAGCTG TATTAACGCC AGGGGATACT ATTGTTACAA GTGAAGCGAC ATTCGGTCAA 960 

20 TATTATCACA ATGCGATTGT TGAATCAGCT AATGTGATAC AAGTACCTTT AAAAGATGGT 1020 

GGCTTCGATT TAGAAGGTAT TTTAAAAGAA GTTAATGAAG ATACGTCATT GGTATGGTTA 1080 

TGTAATCCAA ATAATCCTAC AGGTACATAT TTTAATCATG AGAGCTTAGA TTCGTTTTTA 114 0 

25 TCTCAAGTAC CTCCACATGT ACCAGTAATT ATAGATGAAG CTTATTTTGA ATTTGTGACA 12 00 

GCAGAGGACT ACCCGGATAC ACTTGCTTTG CAACAAAAAT ATGACAATGC TTTCTTATTA 126 0 

CGTACATTTT CAAAGGCGTA TGGATTAGCG GGTTT AC GTG TAGGATATGT GGTAGCAAGT 1320 

30 

GAACATGCGA TTGAAAAATG GAACATCATT AGACCACCAT TTAATGTGAC ACGTATATCT 13 80 

GAATACGCAG CAGTTGCAGC ACTTGAAGAT CAACAATATT TAAAAGAGGT AACACATAAA 144 0 

AATAGTGTTG AACG CG AAAG ATTTTATCAA TTACCTCAAA GTGAGTATTT CTTGCCAAGT 15 0 0 

35 

CAAACGAATT TTATATTTGT AAAAACraAAG CGGGTAAATG AACTTTATGA AGCACTTTTA 1560 

AATGTAGGGT GTATTACGCG ACCATTTCCA ACTGGTGTTA GAATTACAAT TGGTTTTAAA 1620 

GAACAAAATG ATAAAATGTT AGAAGTTTTA TCAAACTTTA AATACGAATA GTAAGTGGGG 1680 

40 

AGTGGGACAG AAATGATATT TTCGCAAAAT TTATTTCGtC GTCCCACCCC AACTTGcATT 1740 

GTCTGTAGAA ATTGGGAATC CAATTTCtCT TTGTTGGGGC CCCGCCGGCA AGGTTGACTA 1800 

45 GAATTGAAAA AAGCTTGTTA CAAGCGCATT TTCGTTCAGT CAACTACTGC CAATATAACT 18 6 0 

TTGTAGAGCA TTGAACATTG ATTTATGTCT CAAGCTCAAT GCAGTGTGAA TGATGAGGTG 1920 

AGAGTATTCA GTGTAAAAAG CAACAATAGA TGATATTGTT TTGTATCAAT TGCTTTTTTG 1980 

60 CTATACTGAA TCAATACTGA TATTTTCAGG AGAAGATTAA AATGACCCGT AAATCAATCG 204 0 

CGATTGATAT GGATGAAGTA TTGGCAGATA CATTAGGAGA AATCATTGAT GCTGTCAATT 2100 
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TTCCTGAACA 


TGATGGATTA ATTACAGAAG 


TATTGAGAGA 


ACCAGGCTTC 


TTCAGACATC 


2220 




TTAAAGTGAT 




UviuAAu 1 A\» 


TGAAAAAATT 


AACTGAACAT 


TATGATGTAT 


2280 


5 


ATATTOCTAC 




/*sft*TViT , x a 


CATCATTTAG 


TGATAAATAT 


GAATGGTTAC 


2340 




TAGAGTTCTT 


TCCATTTTTA 




ATTTTGTTTT 


TTGTGGTAGA 


AAAAACATCG 


2400 


10 


TTAAAGCTGA 


TTATTTAATA 


GlATGACAATC 


CTAGACAGCT 


TGAAATTTTT 


ACTGGTACAC 


2460 


CGATTATGTT 


TACAGCAGTG 


CATAATATTA 


ATGATGATCG 


ATTTGAACGC 


GTAAATAGCT 


2S20 




GG AAAGATGT 


AGAACAGTAT 


TTTTTAGATA 


ATATTGAGAA 


ATAAAATATA 


TCACTTGAAA 


2580 


15 


AATTTCATGT 


AGAAAAGATG 


ATGGATAGGC 


TATAAAGTAA 


TTGTGACTGA 


GATGAACTTT 


2640 




TATGTCTTAG 


ACACTACAAC 


ACTATATTGG 


CAGTAGTTGA 


CTGCGGGGCC 


CCAACATAGA 


2700 




GAAATTGGAT 


TCCCAATTTC 


TACAGACAAT 


GCAAGTTGGG 


GTGGSCCCCA 


ACATAAAGAA 


2760 


20 


ATACTTTTTC 


TTTAGAAATT 


AGTATTTCTT 


ATGCATGAGT 


GTAACTCATG 


CATTCATATT 


2820 




TTTAAGTACA 


CATTAGCTGT 


GACTAATGAT 


AAAGAATCGC 


TACATAATCA 


ATCATTAGTC 


2880 




GTTCTTTATC 


ATTTCOGTCC 


CGCTCTCAAT 


AAATGTTAGT 


CTATCTTATT 


ATTATAAATC 


2940 


25 


GGATGAATGT 


GTTAATCTAT 


GGCAGATTAC 


ACGTCATCCG 


ATTTTTTATA 


GAATTTGAAA 


3000 




AAGACGCATA 


AACCACTATG 


ATTTAAAATA 


CAACATCAAT 


CATTTTAGTG 


gCATGCGCCA 


3060 




AAATTATATG 


TCTGTTTTTG 


AAACAGGGTA 


AT AG CTTAAA 


GCTAAT AAAA 


ACGAATATAA 


3120 


30 


GGTGCGTTGA 


ATCTTATGAT 


TACACTCCAA 


ACCTAATATA 


ATATCGGGTT 


AAGATCATTC 


3180 




CGGATGCTTA 


CAAATCATTG 


ACAGTAAGTA 


ACTGAATGGC 


ATTTGGTATA 


ACCTCAATAT 


3240 


35 


CAATAGGTGT 


TTCTAATGAA ATTTCGCCAT 


CAATATCAAC TTTCATTGCT 


GGATCTGTTG 


3300 


TAAGTGAAAT 


CTTTTTACCA 


GGTATATGCT 


CAATACCTTG 


AGTAATTTCA 


TTCCaATTCA 


3360 




TGCTATCAOG 


CTTTTTAAAA 


ATATCATTTA 


AAATACTGAA 


ACTTTGTTCA 


TTAAAAATGA 


3420 


40 


AAGTGTTCAG 


TTCACCATCT 


TGAGGAGACA 


AATCAGTCaA 


TGGTATACGA 


CTACCACCAA 


3480 




TGAATGGACC 


ATTTGCTGTT 


AGT AT CATGG 


TCGTTTCGCC 


AGAATATGTC 


TTATCATCTA 


3S40 




TTGATAATTG 


ATAATTAAAT 


TGTGTTGGAT 


TTAG CAGTGT 


TTTGACAGTT 


GATCCAATAT 


3600 


45 


AACTCAATTT 


ACCAAATATA 


TCTTTTGAAC 


CATCTTGTAC 


GTTTTCAGCG 


TTTTGAACAA 


3660 




TGAGACCTAA 


GCCAACAAAG 


TTGAGTGCAT 


ATTGATTATT 


TATTTTAATT 


ACATCGTATG 


3720 




TACCAACTTG 


TGCAGAAATC 


ATTTGTTCAC 


TAGCTTGTTT 


ATGATTAGGT 


GCTATATTTA 


3780 


50 


GCGTTTTTGT 


AAAATCATTA 


AAAGTACCGC 


CTGGTAAAAT 


GCCAATAGGG 


AGTTGAAGGT 


3840 




CATGTGTCAT 


AACACCGTTT 


ATAAGTTCGT 


TAACCGTGCC 


ATCACCGCCA 


AGAATAAATA 


3900 
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CACCTTCGTT TTCACTCAAT TGAATAGAAA GATGCTTACA AATTOAACTT AATOCTOTTO 4020 

TAACTTCCCC AATACCTTGA TTAATATTTT TTAATCCACT GTGTTCATGG TAAAAGAGGA 4080 

5 CACCATGTGT ATATTTATTT TCCATAGTTT AGCCTACTTT CTAAAAATTG GTTCATTAAA 4140 

TATATATACC CACTTTTAAT TGTTAATACC AAAAATATGT TTTTAAATAQ AGAAAATGGT 4200 

AATAAATGAA ATTGATTTCT ATAGAGTGGG ACGAGAAAAT ATAGTTATAG CTGTCTATAA 4260 

10 

TGAGCATATT AAGTTTTTAT TTATACTGAT ATCTTGAATT TAATTAATAG AAACCTATAA 4320 

AAAAACAGTA AGCCATTTAA ATGACTTACT GTTTTTTGAA TTAGGCCAAC AATATTAACG 43 80 

TATACCTTTC ATCGCTTTGA TGATTAAAGG TGAGAATGCT AATACAATTG TTGTAACAAT 4440 

IS 

AATTGCAACA ACACCTAGGA AAATAAAGTA ATTTGTTTGA CCTAGTGGTT CTATTAACTT 4500 

AACTAAAGTA CCATTGATTG CTTGTGCAGA AGCGTTAGTT AAGTACCAAA TACTCATCAT 4560 

20 TTGGGCATTA AATGCTTTAG GTOCTAACTT AACAGCAGCA CTATTACC CG TTGGTGATAA 4620 

GCATAGCTCA CCGATAACAC AAATAATGTA CGATAAAATA ACCCAGTTAA CTGAAAAGTT 4680 

TGATGAACCT GATGCATAAC CTACAATACC AATTAGTATG TATGACGCAC CTGCTAAGAA 4740 

25 CGTACCAATT GCAAATTTTA CTGGGAGGCT AGGTTGTTTA GTTCCAAGCT TTTGCCATAA 4 800 

AAGTGAAATA ATTGGAGCTA GTAATAAAAT AAATAATGGG TTAATTGATT GGAAGATCGC 4 860 

TTCACCAAAG TTTGTTTTCC AACCAAATAA GTTTAATTTC ATATCTGAAT GTTCAATTCC 4 920 

30 ATATATGTTT AATACATTAG ACCCTTGTTC TTGAATAGCC CAGAACACCA TTCCAAGAAT 4980 

AAATAATGGA ATAAATGCTT TAACACGAGA ACGTTCAGTA TCAGTGACAT CTTTACTTCT 5040 

AATAATTAAA GTGAAGTAAA TGAnTGGTAA TGCAATACCT AATACTAAAA CAGTATTACT 5100 

35 

AACTAAGTTA AATGATAATG AGTTAGTTAA TGCACCAATA ACGATAATTA ATACAATTGC 5160 

TAAAACAACA CTTCCGATAA TAAGACCATA CTTTTTCTTT TCAGCTGGTG TCAATGGGTT 5220 

AGTAGGTTTC ATACCAACGC TACCTAAGTT TTTGCGGTTG AAAAGTACAT ACCATACTAA 5280 

40 

ACCTAATGCC ATACCAACTG CTGCAATCAA GAATCCGCCG TGGAAGTTTT TAACATTAAC 5340 

AAAGTGTTGC AAAATAATAG GTGATAATAA TGCACCCATA TTAACTGACA TATAGAAAAT 5400 

45 AACAAAACCT GCATCCATAC GTCTATCATT TTCAGGATAT AAACGGCCAA CGATATTTGA 5460 

AATGTTTGGC TTCATTAAAC CTGAACCAAT AATGATGAAG AACATTGATG TGAATAAGCC 5520 

GATTAATGCA AATGGTAAGC TTAAACAAAT ATGTCCGATA ATAATAAAGA CTGCAC CTAA 5580 

SO TAAAGTAGCG CCTCTAGTGC CTGTAATTCT GTCAGCAATC CATCCGCCTG OTATTGATGT 5640 

CATATAGATT AATGAACCAT ArACTGACAT AATTGACATA GCTGTTGTTT TATCAATTCC 5700 
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(2) INFORMATION FOR SEQ ID NO: 191: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14078 base pairs 
<B> TYPE: nucleic acid 
<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 191: 

TGGACTATTA ACGGCGaAGA AGATTTAAOG AAATACTTAC AAACCAATGT TGATGGTATT 60 

ATCACAGATG ACCCAGCATT AGCTGATCAG ATTAAAGAAG AAAAGAAAGA CGAAACATAC 120 

TTCGATCGTT CTATAAGAAT TTTGTTTGAA TAATATAAAC AAAGACCTCT AAAGTTATCA 180 

AGATGATACC TTCAGAGGTC TTTTTAATGT TGCCATCTAT GGGATAGGCA ATCGTTTCAT 240 

TCGTTTATAT TCATATGACA AGTATTTGTA TGGCAATTTG GCGTCACAAA CACTTACATG 300 

ATTTATTGGT GAATTATTAA TTGTTTTGTG AATGCAAAGG GTTAGAAATT GAATTGTAAA 360 

TACTTTCTAA TCTTTGTTTC GCTTTAGTCA TTTGATCCAA ATTTTTAGTG CGTATAGCGG 420 

25 ATTTTGCAAT ATAGTGCGCA CTAAAATATC GCGTTTTTGA AACGCATCTA AATTTAGGTA 4 80 

CGATAATTTA TTTAAGTCAG TGTTTGCTAT TAATTCATGT AATTGATCTA CAAGCGCTTG 540 

ATGTTOATAC GTATGTGATG TAGTTTCAGA TTTGCTTGCT AATTT AAT AC CAGTCGTATC 600 

AAGGAGCGCC GCTTTAATAC CAGCAACTAA ATATGTTTTG ATTTTCATTT GTGTTGTCAT 660 

GCTTTGTTAC TCCTTTGATG TACATTAATC AAAAAAATTA TACACTATTG TATATTGCAA 720 

AGCTAATTAA CTATAACAAA AAGATAGTTA ATGCTTTGTT TATTCTAGTT AATATATAGT 780 

TAATGTCTTT TAATATTTTG TTTCTTTAAT GTAGATTGGG CAATTACATT TTGGAGGAAT 840 

TAAAAAATTA TGAAAAAGCA AATAATTTCG CTAGGCGCAT TAGCAGTTGC ATCTAGCTTA 900 

TTTACATGGG ATAACAAAGC AGATGCGATA GTAACAAAGG ATTATAGTGG GAAATCACAA 960 

GTTAATGCTG GGAGTAAAAA TGGGACATTA ATAGATAGCA GATATTTAAA TTCAGCTCTA 1020 

TATTATTTGG AAGACTATAT AATTTATGCT ATAGGATTAA CTAATAAATA TGAATATGGA 1080 

45 GATAATATTT ATAAAGAAGC TAAAGATAGG TTGTTGGAAA AGGTATTAAG GGAAGATCAA 1140 

TATCTTTTGG AGAGAAAGAA ATCTCAATAT GAAGATTATA AACAATGGTA TGCAAATTAT 1200 

AAAAAAGAAA ATCCTCGTAC AGATTTAAAA ATGGCTAATT TTCATAAATA TAATTTAGAA 1260 

50 GAACTTTCGA TGAAAGAATA CAATGAACTA CAGGATGCAT TAAAGAGAGC ACTGGATGAT 1320 

TTTCACAGAG AAGTTAAAGA TATTAAGGAT AAGAATTCAG ACTTGAAAAC TTTTAATGCA 1380 
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GTTGTATCAT ATTATGGTGA TAAGGATTAT GGGOAGCACG CGAAAGAGTT ACGAGCAAAA 1500 

CTGGACTTAA TCCTTGGAGA TACAGACAAT CCACATAAAA TTACAAATGA ACGTATTAAA 1560 

5 AAAGAAATGA TTGATGACTT AAATTCAATT ATTGATGATT TCTTTATGGA AACTAAACAA 1620 

AATAGACCGA AATCTATAAC GAAATATAAT CCTACAACAC ATAACTATAA AACAAATAGT 1680 

GATAATAAAC CTAATTTTGA TAAATTAGTT GAAGAAACGA AAAAAGCAGT TAAAGAAGCA 1740 

10 GATGATTCTT GGAAAAAGAA AACTGTCAAA AAATACGGAG AAACTGAAAC AAAATCGCCA 1800 

GTAGTAAAAG AAGAGAAGAA A0TTGAAGAA CCTCAAGCAC CTAAAGTTGA TAACCAACAA 1860 

GAGGTTAAAA CTACGGCTGG TAAAGCTGAA GAAACAACAC AACCAGTTGC ACAACCATTA 1920 

IS 

GTTAAAATTC CACAGGGCAC AATTACAGGT GAAATTGTAA AAGGTCCGOA ATATCCAACG 1980 

ATGGAAAATA AAACGGTACA AGGTGAAATC GTTCAAGGTC CCGATTTTCT AACAATGGAA 2040 

CAAAGCGGCC CATCATTAAG CAATAATTAT ACAAACCCAC CGTTAACGAA CCCTATTTTA 2100 

20 

GAAGGTCTTG AAGGTAGCTC ATCTAAACTT GAAATAAAAC CACAAGGTAC TGAaTCAACG 2160 

TTAAAAGGTA CTCAAGGAGA ATCAAGTGAT ATTGAAGTTA AAC CTCAAGC AACTGAAACA 2220 

25 ACAGAAGCTT CTCAATATGG TCCGAGACCG CAATTTAACA AAACACCTAA ATATGTTAAA 2280 

TATAGAGATG CTGGTACAGG TATCCGTGAA TACAACGATG GAACATTTGG ATATGAAGCG 234 0 

AGACCAAGAT TCAATAAGCC ATCAGAAACA AATGCATATA ACGTAACAAC ACATGCAAAT 2400 

30 GGTCAAGTAT CATACGGAGC TCGTCCGACA TACAAGAAGC CAAGCGAAAC GAATGCATAC 2460 

AATGTAACAA CACATGCAAA CGGCCAAGTA TCATACGGAG CTCGTCCGAC ACAAAACAAG 2520 

CCAAGGAAAA CAAACGCATA TAACGTAACA ACACATGGAA ACGGCCAAGT ATCATATGGC 2580 

35 GCTCGCGCAA CACAAAACAA GCCAAGCAAA ACAAATGCAT ACAACGTAAC AACACATGCA 2640 

AACGGTCAAG TGTCATACGG AGCTCGCCCG ACATACAAGA AG C CAAGT AA AACAAATGCA 2700 

TACAATGTAA CAACACATGC AGATGGTACT GCGACATATG GGCCTAGAGT AACAAAATAA 2760 

40 

GTTTGTAACT CTATCCAAAG ACATACAGTC AATACAAAAC ATTACGTATC TTTACAACAG 2820 

TAATCATGCA TTCTATGATG CTTCTAACTG AATTAAAGCA TCGAACAATC GGAAGCATAT 2880 

TTCTAAATTA TTTATTCATT ATAGTCTTAA ACATAACATG ACCTAATATA TTACTAACCT 2940 

45 

ATTAAAATAA ACCACGCACA TCTAAGTGAT ATACGACAAT CACAGCAATA ATAATTGCTT 3000 

TAGAAAGTCG TGCCGAACTG GAACTTAGAA GTCTAGTTCG AACACACACT GATGTGAGTG 3 060 

so GTTTTCTTTA TTTTAAACAT GAACAATCAG ATAAGTTACT AG CATT AG CA AATATTATTA 3120 

AATCAAAGGG CTTCGATTCA TAAAATTTAA AACAATGATT AAAATTAGAC GTGTAAATGT 3180 
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TATTTCACAC AGCTTCATTA ATAAAACGAA ATTGCTTCAA CCCGCTTCAA CTTCAACTGG 3300 

CTTCAACTTC AGCCTACTTC ATTCAATAAC AAAACGAATC CGCTTCATCC AAAATCAACC 3360 

ATTCTAACGC ACATATTCAA ATATAGCAGC TGCACCCATG CCGACACCAA TACACATCGT 3420 

AACCATGCCG TAACGGCTAT CGGGACGTCT ACCCATTTCA TTAAGTAAAC GCGCGQTTAA 3480 

CATTGCGCCT GTAGCACCTA ATGOATGACC TAAAGCAATA GCGCCACCAT TCACATTCGT 3540 

ACGTGATATA TCTAGACCTA CTTCTTTAAT AGATGCAATC GTTTGAGAAG CAAATGCTTC 3600 

GTTCAATTCG ATCAAATCAA TGTCTTCAAC AGATAGATTG CTGAGTGACA ATACTTCAGG 3 660 

AATCGCATAT GCAGGCCCAA TACCCATAAT TTTCGGGTCA ACGCCTACTG CCTTAAAACC 3720 

AACGAATCGT GCAATAGGTG TCACGCCGAG TTCTTTCACT TTATCTCCAG ACATTAAAAC 3780 

TACAAATCCT GCACCATCAG AAAGTGGGGC AGATGTTCCT GCAGTCATAG TGCCGTCAGC 3840 

TTTAAATACT GTACGTAATT TGGCTAATGC CTCCATCGTG GTGTCAGGGC GTATAAATTC 3900 

ATCTTGGTCA AAGATATTTG TGTGTACTTT TGGTCCTX3CG TTTGTATATT CAACTGAGTT 3960 

TACTTGTATT GGAATAATTT CATCTTTGAA CCGACCATCA CGTTGTGCGT CATAGGCACG 4020 

25 TTGATGACTT CTGACAGCAT AAGCATCTTG ATCTTCGCGT GATACGTCAA ATTGGGATGC 4080 

TACATTTTCA GCAGTTAAAC CCATAGGATA TGACGCACCT ATATCATCAT ATTGTAAGGT 4140 

TGGATTGTTT GTGGGCTCGT TGCCACCCAT TGGTACGGCA CTCATCAATT CAACGCCACC 4200 

30 AGCTACAAGT ATATCTCCTT GACCAGCCAT AATTTGATTG GCTGCAATCG CGATGGTTTG 4260 

TAATCCTGAT GAGCAGTAGC GATTCACTGT TTGACCCGGT ACCGTGTCAG ATAATCCCGC 4320 

ACGCAATOCA ATCGTTCGTG CAATGTTTTG GCCTTGTAAT CCTTCTGGAA AAGCCGTACC 43 80 

AACAATGACA TCTTCAATCA TATTCTTATT GAATTTTCCG TCAATACGTT TGAATACGCC 4440 

TTCKVATACT TTGGCTGCGA CATCATCAGG TCTTTCGTGG AATAATGCGC CTTGCTTTGC 4500 

TTTCGCTGCG GCTGAACGCC CATAAGCTAC AATGTATGCT TCTTGCATGG TTATCATCCT 4560 

CTCTTAATGA CTATCTTTTA ATTACGTAAT GGCTTACCAG TTTTTAACAT ATGTGCAATT 4620 

CTTTCATATG ATTTTTTAGA TTTTAGTAAG TCAATAAAGC CAATTTTCTC CAACGATTGA 4680 

ATGTAACGTT GATTGATAAA TGTATTTCTT GGTAAATCAC CACCCGCTAA AATTGTGGCG 4740 

ATATTTAAGG CAATATGATA ATCATGGTCG CTAATAAAAT GACCCCGTCT TTGCGCATCT 4800 

AATTGTCCTT GGATCAATGC TTTGAAGTCT TCACCTAAAG CGATATATTG ATGTCTAGGA 4860 

50 TTCGGAATAT AGTTTGTTTC TGCTTCATAT TTCGCACGTT TGAGCGCAAC TTCGACACGT 4920 

TGTGCTGTAT TGAAAATAAT CGTATCTGTA TGACGTAAAT AACCATAACG ACGTGCCTCA 4980 
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TGTTTGTCAT CAAACTTATG CQATGTGCGT AATATGCOAT CAGCCATTTC TGCAAGGCCA 5100 

CCGCCACTCG GTAATAAGCC AACACCTGCT TCAACAAGAC CGATATATGT TTCACTTGCA 5160 

5 GCGACAACAA TAGGTGAGTA AAGTACAAGC TCACAGCCAC CGCCTAAGGC ACGACCTTGA 5220 

ACAGCTGTGA CTACTGGTTT CAAACTATAC TTCAAACGAT TAAAGCTATA ATGTAATTTA 5280 

TCAATTGATT GTGCAACGAC ATCATCTACA AGACCGTCTT CATGCGCCTT TTTCATTAAG 5340 

10 AAAAGGTTAG CACCCACACT GAAATTGTTA CCATCTG CAT AAATAACCAT ACTTGTGTAA 5400 

TGGTCATTTT CCAGTAAATC AATCGCATCA ACTAACGCAT CGTTGAATTC ATCGGTAATG 5460 
ACATTATTTT TACTTTGTAA TTTCAGTAAC AGTTGATCAT CATGAGTTAC GGAAAGTTTG . 5520 

IS 

GCATCACCTT TATCCCAAAG TTCATCTTTT ACGAAGTGAG AAATAGGTGT TGCATATTCA 5580 

ATGGTCTCAT CTTGTTTATA AAAGCCACCA TCTAAATCAC TAATCCATTG TGGTAAGTCT 5640 

CCAAGTTCGT CTTCCATACG TGTTTTAACA CGTTCGTATC CCATTGCATC CCATAATTGG 5700 

20 

AATGGACCAA GTTTCCAGTT GAACCCCCAG ACAAGCGCAC GGTCTATGTC TCGGAAATCA 5760 

TCGGTAGCTT TAGGTACATT GATAGCAGAG TAATAGAAAT TATTACGTAA TGTCTCCCAT 5820 

2S AAAAATAGTC CCGCTTCGTC TTGCGCATTG AATATGGTAT CAAGGTTATG CACTAAGTCT 5880 

TTATTAAATT CATTTAAAAT TGGTAATTGT GGTTGCGATA CAGGTACATA ATCTTGTTTT S940 

TCAACATCGT AAACAAGTCG AGCTTTAGTT TCTTTATCCT TTTTGTAAAA TCCTTGTTTC 6000 

30 GTTTTACGTC CGAGTGCGCC ATTGTCAAAC AACGTATTTA CAATTTTGAC ATCATGAAAA 6060 

TAAGGTGTTT CTTCAGGTAC TTGTTGCATG CCTTTAATTA CAGACACTGC AATATCTAAA 6120 

CCGACTAGGT CAGATAGCGC ATATGTACCT GTTTTAGGAC GACCAATCGC TTGCCCAGTT 6180 

35 AAAG GAT CCA CATCTACAAT GCTTATCTTG TGTTGCTCGG CGCGATACAT AATATCATTC 6240 

ATTQTTTGCG TGCCGACTCT ATTTGCGACA AAGCCAGGCA CATCATTGAC GACAATGACA 6300 

CCTTTACCTA ACACATTTTG CGCGAAATTT TTTACATCTA ATATAATAGA TTCCTTCGTG 6360 

40 

TGTGACGTAG GTATTAACTC CACTAATTTC ATAATACGTG GTGGGTTAAA GAAATGTAGA 6420 

CCAAAGAATC GTTCTTGATC CTTCTCGTTA AATGCTTGAG CAATCGCATT AATTGGAATA 64 80 

CCTGATGTAT TTGTAGCGAA TAAAGCATCT TCTTTAGCAT GTTGTAGAAC TTGTTGCCAA 654 0 

45 

ACAGCATGCT TAATTTCAAT ATCTTCTTTG ACTGCTTCGA TATATAAATC AGCATCATCA 6600 

TTTACCAAGT CATCATCAAA ATTACCATAT GTTAAATGAC TCGCTAGATT TAAGTCGAAT 6660 

60 AGTAGCGGCC GTTTCTTATC TGTAATTTTA TCGTAAGATT TTTTCGCAAT GAGATTTGGA 6720 

TCGTTTTTGT CCACTACAAT ATCTAATAGT TTTACTTTAA GTCCAGCATT CACAAAAAGT 6780 
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GTGATTCCTC CAATTTAGTT GAGOATAAGA 
TATTTTATAA AATTAATTAA GTATCTTTGA 

5 AGCTTTATGC TTAAAATAAG TCTTTTTTAG 

CTATTTATAC GAAAGCAGAA TCTCCAGTCA 
CATGTGTACC TTCGTACGTG TAAATCGCTT 

W AATCGTCAGC TAGTATGCCA TTACCACCTG 

GCAAACGTAA GGCATTCATC ATCTTCGCCG 
GTGCTTGCAT ATTAGCTAAT TGAGCACATG 

15 

TCATTGCTAG CTTTTCTTGT ATTAACTGAT 
GCTCAOTGAC ATAATCTAAT GTGGCACGTA 
AAGCAACGCC TGCTCTCGTT GAATAAAGAA 

20 

TTTGTAAGOG ATCCGCTTCA TCTACTTTGA 
CAATGCGAAG TGCGATTTTA TTATCAATGA 

25 TGACTACAAA GCAATGGGGT TTGCCAGTTT 

CAGATACATG TGCACCACCA ATCCATTTCT 
GGCGTTCAGC GACTGTTTCA AGACCTCCCG 

30 AAGCAAAGCA TGTACGCAGT TCATGTGACT 

CTTTGCTACC TCCGAAATAG AAAGTGTTAT 
TAGCTAAGGA AATATCAAAT CGCGCGAGTA 

55 TAGGCATTTT GGCGTTTGGA CGATCCTTGT 

. CTC&AGATC TTTAAAATAG TCCTCGGGTA 
TTTCACGGTA CTTACTTTCT AG CAATGAAT 

40 

CTGTTAAACC TTTAGCAATA CTAAGTACAT 
CTTTTTCAAA TGTCATATAA ATTCCTCCTA 
TTTAATTCAA AAACAACACG CTTTATTTGT 

45 

ATCACCTTTA AAGTGTTTGC GAGACTTTGT 
CTGGTTTCTG CGTACTGTTT AACGGCATAT 
SO TATAACCTGC TAAACGACTt CGCATATGTT 

CTTCGCGAAG TATAATGGCT GCAGCAATTG 



TAACCATTAA GATAATTGGA ATAACGTTGC €900 

CAGTCATCTT AGCCTCTTAT TTAAGGAAAA 6960 

TGAAATTAAT GCATCTCATA TAATTATTTG 7020 

AAGCGCGTCC AATTACTAAG GCATTAATTT 7080 

CTGCATCAGA GAAGAAACGT GCAATATCAT 7140 

TAATACCGCG GCCCATAGCT ACTGTCTCAC 7200 

TTGAAGTTQC AACCTCGTCA TATTCACCAT 7260 

TTGCCATTGC TTGAGCTAAA TTACCTTGCA 7320 

ATTTACTAAT TGGTTTGCCG AATTGcTTAC 73 BO 

AAGCGCCAGC CATACCACCT GTAG CCATAT 7440 

TTTTGGCAAT ATCTTTAAAG CTTGTTATGT 7S00 

CATTAGTTAA TTTAATTAGG GCGTTAGGAA 7560 

CTTCAATATC GACGCCATCT TGTTCTGGTC 7620 

CTTTATTTAC TGCGAATACT GGAATGACAT 7680 

TTTCACCATT GATAACCCAA GTATCGCCTT 7740 

CAACGTCCGA ACCGTGTTCT GGTTCAGTTA 7800 

GTAATTTAGG TACATATTTC GCAATTTGTT 7860 

GCCCTAAACC TTGGTGAACA CCGAGTAGGG 7920 

GGTAAGACAT GAAAAACTGA AATAGTTGAC 7980 

AAAGTAATGG ATTGTTAAAA TAATTTAATT - 8040 

CAGTAGCGTC TATCCAATGT TGATTAATAT 8100 

CTACTTGTTG TAAAAATTCG ACTTCACCGT 8160 

CTTCAGGAAA TAATGTTTTT AAGACCGTTT 8220 

AAAATAATAT GAATACTAAT GTGAAATGCA 8280 

AAACGCTTAC ACTAAATGTC AAAAATTTTT 8340 

CATTCATCAT TTGTCGAATC G CAAGTTT AT 8400 

GTGTCACTGG TACATACATT CTTGGGACTT 8460 

GATTTAAAAT TTCAGCGTAA TGAGGTTCAT 8520 

ATTCACCATA TTTTGGATGA TCATAGCCAA 8580 
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AGACATTTTC 


GCCACCAGTT 


ATGATTAATT 


CTTTTTTGCG 


GTCAATAATA 


AATATATCGC 


8700 




CATCGTTGTC 


CATCTTCGCT 


AAGTCACCAG 


TTAATAAATA 


TCGACCATGA 


AATGCTTTGG 


8760 


5 


CAGTCTCTGC 


TGGTTTATTC 


CAATATCCTG 


GCGTGACATT 


TTTAGCCTTA 


ATTGCAAGTT 


8820 




COCCAATCTC 


ACCAGTAGGT 


ACTTCCTCAC 


CGTTATCATC 


AAGGATACGT 


GCATCAACGA 


8880 




ACATGACTGC 


TTTACCAATA 


CTCATTGGCT 


TACGTTTTGA 


ATTTTCCGGT 


GTATTAACAA 


8940 


10 


GTACAAGAGG 


TGCTTCAGTT 


AAACCATAGC 


CGTTAATAAT 


GTTTATGCCA 


TATTGTTTAA 


9000 




AAGCTGCTTG 


GATACTTGGT 


AATGGTTGTG 


AACCACCTTG 


GATGATATAA 


TCCATAGCTC 


9060 


15 


TAAAATTTTC 


AGGATTAAAA 


TTACTAG CAC 


GTAGCGTACT 


ATAATACATT 


GTCGG AATCA 


9120 


TGATAATAAA 


TGTAGGGTGA 


TATTGTGCAA 


TCATGTCATT 


CAATTCTTCG 


CCGTTAAAGT 


9180 




AACGTTGAAG 


AATAAGTGTG 


CCACCTGACA TTAATACTGG 


TAATACAGTA 


TCGTTAAACC 


9240 


20 


CTAAAACATG 


GAACATTGGT 


GTTGATACAA 


TCGTAATATA 


GTTTGAATTG 


AACTTATACG 


9300 




TCAGGTCTAA 


GTTTGCACCG 


TTATGAACAA 


ATGATTCATA 


TGAGAACATC 


ACACCTTTAG 


9360 




GTGATCCGGT 


TGTACCACTT 


GTATAAATTA 


ATGCTGCAAG 


ATCTTGTGGT 


TCAACAGGTG 


9420 


25 


TTGCTTGAAA 


AGGTTGGTGA 


TAATCTGGAT 


TTACGATTTC 


ATCATATTGC 


GCCACATCAA 


9480 




TATCCATATG 


CAATAAGTTT 


TGGTCAATAT 


CGGTGAGTGA 


ACTTAAATGT 


TTTTCAGCAT 


9540 




AG AAGAG CAG 


TTTTAATTGT 


GCATCTTCCA 


CAATGGCTGC 


AATTTCTTTT 


GGGTTAAGCC 


9600 


30 


GCCAATTCAA 


TGGTAAAAAA 


ACCGCACCTG 


TTTTAAAACA 


AGCAAACAAT 


AAATCTAATA 


9660 




TTGCAATATC 


ATTTGGCGCA 


AAAATACCGA 


TAACATCGCC 


TTTTTTAACA 


CCTTGAGATG 


9720 




TTAAATAATG 


TGCCATATTA 


TCAGCGCGTG 


CATTGAGTTG 


TTGGTATGTC 


CAAGATGTTT 


9780 


35 


GTTTTGCdTG 


ATCAATAACG 


GCAGGCTTGT 


CATCATCGAA 


GTCTGAACGC 


GTTTTTATCC 


9840 




AATOGAAATT 


CATTAGTATA 


CCCCCTTTAG 


CTTCACTTTC 


ATACTTTATG 


AATTGATTGT 


9900 


40 


TTAAGTTGTC 


CCCATTTTTC 


TTTGTAAATG 


CTGGTATCAA 


TTAATTTTAA 


ATGATCAGCA 


9960 


ATAATTGGTT 


TAAAAGCCAT 


TTGATTCAAA 


ATATCTTTAT 


GCAAATCAAG 


ACCTGGTGCA 


10020 




ATTTCAATTA 


GTTTCAAGCC 


TTGATTGGTG 


AGTTCGAATA 


CTGCACGATC 


AGTAACAAAA 


10080 


45 


TAGATTTCTT 


GCTCGAGTGA 


TTGTGAATAT 


TGTGCATTAA 


AGTCGATATG 


GCTCACATCT 


10140 




GATACAAATT 


TCTGGTTTTG 


TCCTTCAGTT 


TCAATGTTTA 


ATCGTTGATT 


ATGGCATGAG 


10200 




ACATGACTGC 


CAGCTACAAA 


AGTACCTGAA 


AAGATAATTT 


TATTTACAGA 


TTGCGTAATG 


10260 


50 


TCTATAAAGC 


CACCACATCC 


ATTTAGTCGG 


TCATTGAAGT 


AAGACACGTT 


GACATTGCCG 


10320 




TATTGATCAA 


CCTCAGCAAA 


G CT AAGAT AG 


G CAACTG AT A 


CACCATTGTT 


ATAAATAAAA 


10380 
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CGACTCCCAA 


CGAATCCACC 


GAAAATGCCA 


ACATCTAAAA 


TCGGTTGCAC 


ATCATGTTCA 


10500 




ACACATTCTT 


CATGCAATAA ATTAGAGAGT 


TCATTATTGA 


TGCCATAACC 


GATGCTAATT 


10560 


5 


GTATCGCCAT 


AAGTTAAAAA 


CTGAGCAGCA 


CGTCGGAGAA 


TCAATTTGCG 


ACTATTAAAA 


10620 




GGTAATGCGG 


GTTCAGGTAT 


TCCATCAATT 


CGTTCTTCTC 


CAGACAAGGC 


TGGTAAATAA 


10680 


10 


TGACTTTGAA 


TTACTTGGCG 


GTGATTCTTT 


TCATCTTCTG 


TGACGTATAC 


ATAATCGACA 


10740 


AGATTTCCTG 


GGATAACAAC 


TTCATTCGGT 


TTTAGTTGAT 


AGTCGTCAAC 


TAAAGCTTTA 


10800 




ACTTGTACAA TAACTTTCCC ATGATTGGCT 


TTCGCGTTTA 


ATGCGACATG 


ATAACACTCG 


10660 


15 


CTCAAGTACG 


CTTCTTGAGT 


TAAATAAATG 


TTACCTTGTT 


GATCTGCGTA 


TGTTCCTCTC 


10920 


AGTAGTGCCA 


CATCAACGCT 


AGGGAATGTG 


TAATGTAAGT 


ATGTTTCATC 


GTTGATGGTT 


10980 




ACTAATGAAA 


CTAAATCATC 


CGTTGTTOGT 


GTATTTACTT 


TACCGCCACC 


GTATCTAGGA 


11040 


20 


TCAACAGCTG 


TGTTTAATCC 


GATTTTAGTA 


ATAACTCCAG 


GTAATAATTG 


ATTACTCTGA 


11100 




CGATAATGAG 


TTGCAATGAT 


ACCTTGTGGT 


AAAAAATAAG 


CTTCAATGTC 


ATTATTTTTC 


11160 




ATTGcTTGTG 


CCGTTTTGGA 


AGAAGCCGTT 


AAAATACTCA 


TAATX3ACACG 


TTTAATCATG 


11220 


25 


CGACGTTCTA 


TAAAATCATC 


TAAATCCGGT 


GCGGCACCTA 


AACTATGAAT 


ATCATTCGCT 


11280 




AATATAAACG 


TTAAATCATT 


GGGCGTATGA 


TATGTGTCAT 


GTTGCGCTAA 


CACAGCACGT 


11340 




AGAACTTCGG 


CGGGTAAGTT 


GGCTACAGCT 


AATGCTGGTA 


AACCAATCAC 


ATCACCATCT 


11400 


30 


TTAATGATAT 


GTTGTAAGTC 


GTGCCATGTG 


ATTTGTTTCA 


AGCAAGTCAC 


CTCCATCACA 


11460 




TTTGATAAAA 


TATAGCGTTT 


TTACACTTTG 


TGTAAACCCT 


TaCAAGAAAT 


ATAACATAAC 


11520 




GACGTTTAAA 


ATCAATTAGA 


AATATCTTTT TATTCTGATA 


ATAGACACAG 


TATAGACACA 


11580 


35 


TTTTGATGGT 


CGATAACAAT 


TGTAATATCA 


AGGGTTTGTA ATGAATTGAA 


TATCATTAAA 


11640 




ATACTTATAT 


AAAAATATTG 


TTCGGAATAT 


AAAAAGTTAA 


ATAGGTTTTG 


ATTTTTAAAT 


11700 


40 


ATGAAATACA 


AAGTGCCCAA 


TCGAACAAAG 


TATTTATATT 


AAAATATGGA 


AAATCCATCA 


11760 


ATATTAAATT 


AAAATAGTTT 


TATTATGAAA 


AGTGAAAGTA 


GGTAAGTCTA 


TGGAAGGTCT 


11820 




TAATCATCGA 


AGAAATACAG 


AAAAAGAAGA 


GACAACACAA 


ACGCAATCaG 


TTGCACCTAA 


11880 


45 


TACAGGTGAA 


GAGGGGATGT 


CATCAGCAAG 


TACACAATCA 


ACTAAGACGT 


CCGACATACA 


11940 




TAATGAATCT 


ATCGATAAAC 


AAATGGAAGC 


TAAAGOGCAT 


GAAACAGCGC 


AAAATACAGA 


12000 




TTTAAAAAAC 


GAAGCAAGAA 


GTTTATTTGA 


TAATGCAACC 


AAATCAATOG 


GTAGACTAGC 


12060 


60 


GGGCAATGAT 


GAAAGCTTAA 


ATCTTAATTT 


AAAAGATATG 


CTTTCTGAAG 


TATTTAAGCC 


12120 




GCATACTAAA 


AACGAAGCAG 


ATGAAATATT 


TATAGCGGGT 


ACTGCTAAAA 


CTACGCCAGC 


12180 
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TTTCACAGTA ACATTTATTG GATTATGGGT CATGGCAGCA ATTTTTAATA ACACTAACOC 12300 

GATTCCGGGT CTCATTTTT A TAGGGGCTTT AACAGTACCA TTATCGGGTT TGTTCTTCTT 12360 

TTATGAATCA AATGCGTTTA AAAATATTAG CATTTTTGAA GTTATTATCA TGTTCTTTAT 12420 

TGGCGGCGTA TTTTCATTAC TAAGTACGAT GGTATTATAT AGATTTGTCG TTTTTAGTGA 124 80 

TCAATTCGAA AGGTTTGGTT CTTTAACATT TTTCGATGCA TTTTTAGTAG GATTAGTTGA 12540 

AGAAACTGGA AAAGCACTCA TTATTGTTTA TTTCGTCAAT AAATTGAAAA CAAATAAGAT 12600 

TTTGAATGGA TTATTAATCG GTGCTGCTAT TGGTGCAGGG TTCGCAGTTT TTGAATCAGC 12660 

AGGTTATATT TTGAATTTCG CTTTAGGAGA AAATGTCCCA TTATTAGATA TTGTCTTCAC 12720 

ACGTGCGTGG ACTGCGATTG GTGGTCATTT AGTTTGGTCA kCGATTGTTG GTGCTGCAAT 12780 

AGTTATTGCG AAAOAACAGC ATGGCTTTGA ATTCAAAGAT ATTTTTGATA AACGCTTTTT 12840 

AATATTCTTT TTATCAGCCG TTGTTTTACA TGGCATTTGG GATACATCTT TAACTGTACT 12900 

TGGCAGTGAT ACGTTGAAAA TATTTATTTT AATCGTTATT GTGTGGATAC TTGTATTCaT 12960 

TTTAATGGGG GCAGGTTTAA AACAAGTGAA TTTACTGCAG AAAGAATTTA AAGAACAACA 13 020 

2S GAAAAAAGTA GACGAATAAT AATTAAAGCT TATGTTGCTC ATATGTTTGT GACATAAGCT 13 080 

ATTTTTATAA TTTGTCTTTA AAAGAGTGGA ATAGGAATAC TTTTTGGAGT TAAAAAAGTG 13140 

TTtCACGTTA AACAAATAGT GACAATTAGA TTTATATAAA ATGAACATGA TTCACTGAAA 13200 

30 GTATGTAATA ATCATTTTAT TGAAATTCAT CAAACAGAAA TTAATACAAT CAT ATAAG CA 13260 

AATTAAACCA CGCCATAATC ATATTGGATG ACTTCGGCGT GGTTTTTATA GTTGAAGCAG 13 320 

GGCTGAGACA TAAATCAATG TCCCACACTC CCTTATCGTT CAATCGTTGT TCGATAAT CG 13380 

ATTAAATAGA TACCTTCAGG TGTTACTTTA TAATTTTTAA C CTT AGAGTT AGCAGCGACT 13440 

ATTffiATCGT TGTAAGCAAT ATAACTGTTT GGTACATCTC GACTTGATAA TTTAATAATA 13 500 

TCATTAGAAA TATTGTGACG TTCCTTAACA TCTACAGTAT GATTCAATTG ATTAATTAAA 13 560 

TCATCGACGT TGCTATTATT GTAGTCTCCT TTATTAATAG CACCATCTTT TTTATATGCT 13 620 

TGATTAAAGA AATAACCTGT ATCTCCACGA GGAATTGTTC CGAAACTATA CATCGTTGCA 13680 

TCCCATGCAG AACGGTCTTT TAAGTAACCT TCTATGTCAT CAACACTTTT AATGTCGATT 13740 

TCAATATTTG CTTTTTT A GC ATCTGATTGT AATACTTGCG CAATTTTCGA TAGCTCTGGA 13800 

CGACCGTCAT ACGTAATTAA CTTAATTTTT AAAGGGTGTT CTTTTGTATA ACCATCTTTA 13860 

60 GCTAATAACA TTTTTGCTTG TTCGATATTT TGTTTGGTTA ACTTAGGTTC TTTAATATAT 13 920 

GGAATTTTAT CATTAAATGG ACTCGTTGCA GGTTTCGCAT AACCTTGATA AATATGATCT 13980 
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TTATtAGTAT GATTATACAT AAGTaAGAAG TTCTAAAn 14078 
(2) INFORMATION FOR SEQ ID NO: 192: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 486 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

10 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 192: 

TGAAAACTAA AGTGTTTCTA ATGCGTGACT AAAATTAGTA ATAATTAAGT TCTCATGATA €0 

ATAGGTATTT TTGAAAAATG GAGGAGTCTA TAAATGGGTA AAAAAATGGG TCTAGGTTTA 120 

TCTATTGCAT TGGTTGTTAT TGGTATTGCC GTTGTATGTT TAATGATTTT TTCTAGTCAA 180 

AAAACOACTT ATTTTGGTTA TATGAATAGT AATACAAATG CAGAAAAAGT TGTCAGTGAA 240 

AAAGATGGAT TAGTCAAACA TAATATCAAA GTAGAACCAT CTAATGATTT CAAGCCGAAA 300 

AAAGGAGACT TTGTAAAATT AGTTTCTAAA GATGATGGGA AGACATTTTA TAAACAAGAG 360 

ATTGTTAAAC ATGATGACGT CCCACACGGT TTAATGATGA AAATTCAOGA CATGCATATG 420 

AATTAATAAA AAAGCATCTA TAACGTAATT TTGAAGAAGT AGAGTTATCT TCTTATGCGT 480 

TTTAGA 486 



(2) INFORMATION FOR SEQ ID NO: 193: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1626 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 193: 

40 



45 



60 



GAGGTCTATA 


TACAATTATG 


GTTGTTCCAG 


TTAAACGAAC 


TGATGGCTTT 


ATTACTAAGT 


60 


TTAATAGATT 


AATTGAAAGA 


CGATTATTAC 


GTCATTTCAG 


TAAAAAAGGT 


TATATCACAT 


120 


GGGAGGAAAA 


TTGATTGTCT 


GACATTTTAA 


AATGTATCGG 


TTGTGGTGCG 


CCACTTCAAT 


180 


CTGAAGATAA 


AAATAAACCT 


GGTTTTGTAC 


CAGAGCATAA 


TATGTTTCGT 


GATGACGTGA 


240 


TTTGCAGACG 


TTGTTTCCGC 


TTGAAAAATT 


ATAACGAATT 


CAAGATGTAG 


GATTAGAAAG 


300 


TGAAGACTTT 


TTAAAATTAT 


TATCAGGACT 


TGCGGATAAA 


AAGGGTATTG 


TCGTCAATGT 


360 


CGTGGATGTA 


TTTGACTTTG 


AAGGATCATT 


TATTAATGCA 


GTTAAACGTA 


TTGTCGGAAA 


420 
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TCGAGTTAAA 


GAATGGTTAA 


AACGAACAGC 


AAGAAAATAT 


GGTTTGGAAG 


CTGACGATGT 


540 




CGTATTAATT 


TCAGCTGAAA 


AAGGCTGGGG 


CATAGACGAC 


TT ATT AT CAT 


CAATTGCGAA 


600 


5 


TATTCGAGAA 


AATGAAGATG 


TGTATATTGT 


AGGGACAACG 


AATGTTGGGA AATCTACATT 


660 




GATTAATAAA 


CTGATTGAAG 


CTAGTGTTGG 


TGAAAAAGAT 


GTAGTAACAA 


CTTCAAGATT 


720 




CCCTGGAACA 


ACTTTAGATA 


TGATAGATAT 


TCCTTTAGAT 


GAAACATCAT 


TTATGTATGA 


780 


10 


TACACCAGGT 


ATTATTCAAG 


ATCACCAAAT 


GACGCATTTA 


GTTAGTGAAA 


AAGAATTGAA 


840 




AATTATTATG 


CCTAAGAAAG 


AAATAAAACA 


ACGCGTATAT 


CAATTAAATG 


AGGCGCAGAC 


900 


15 


ATTATTCTTC 


GGCGGTCTAG 


CGCGCATAGA 


TTATGT AT CA 


GGTGGTAAAC 


GTCCGTTAGT 


960 


TTGTTTCTTT 


TCTAATGACT 


TGAATATACA 


TCGTACTAAm 


ACGGAGAAGG 


CTAATGATTT 


1020 




ATGGCGTAAT 


CAACTTGGCG 


ATTTATTAAC 


GCCACCTGGA 


AATCCACAAA 


ATTTTGATCT 


1080 


20 


TAATGAGGTA 


AAGGCTGTTA 


GACTTGAAAC 


AGGCAAAGAG 


AAACGCGATG 


TTATGATCTC 


1140 


TGGTCTAGGC 


TTTATAACTA 


TAGGACCAGG 


GGCTAAAGTA 


ATCGTTCGTG 


TTCCTAAAAA 


1200 




TGTTGAkGTT 


GTATTAAGAA 


ATTCTATTTT 


AT AAGGTG aT 


TAAAAAAATG 


AAATTTGcAG 


1260 


25 


TTATAGGAAA 


TCCTATTTCA 


CATTCCTTGT 


CGCCCGTTAT 


GCATAGAGCA 


AATTTTAATT 


1320 




CTTTAGGATT 


AGATGATACT 


TATGAAGCTT 


TAAATATTnC 


CAATTGAAGA 


TTTTCATTTA 


1380 




ATTAAAGAAA 


TTATTTCGAA 


AAAAGAATTa 


GAAGGCTTTA 


ATATCACAAT 


TCCTCATAAA 


1440 


30 


GAACGTATCA 


TACCGTATTT 


AGATTATGTT 


GATGAACAAG 


CGATTAATGC 


AGGTGCAGTT 


1500 




AACACTGTTT 


t G AT AAAAGA 


TGGCAAGTGG 


ATAGGGTATA 


ATACAGATGG 


TATTGGTTAT 


1560 




GTTAAAGGAT 


TGCACAGCGT 


TTAnCCAGAT 


TTAGAAAATG 


CATACATTTT 


AATTTTGGGC 


1620 


35 


GCAGGT 












1626 



(2) Information for seq id no: 194: 
(i) sequence characteristics: 

40 (A) LENGTH: 635 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 194: 
AGGGTTAATT GTCGGTTTAA TTGCAATGAA TAAGTTCCAT GTATTAGCTG GCTATAGAGC 60 
B0 GAAATTCATC TTAATGGTGA TTTTAACTAT GATGGTCTTC GTACTTATTA ATACGTATTT 120 

ACTAAGACAG GTAAAATCTA TCGGTATGTT CTTAATGATT GCTGCATTGG GTCTATACTT 180 
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GTCTTATATC GATAACATGT TCTTCAATTA TTTAAATGCA GAGCATCCTA TAGGCTTGGT 300 

GCTAGTAATA TTAACAGTAC TTGTGATTAT TGGCTTTGTA CTGAACATGT TTATAAAACA 360 

5 CTTTAAGAAA GAGAGATTAA TCTAATGTTG ATGAATAGCG TGATTGCTTT AACTTTTTTA 420 

ACAGCATCTA GCAATAATGG CGGACTTAAT ATTGATGTGC AACAAGAAGA GGAAAAGCGA 480 

ATCAATAATG ATTTAAATCA ATATGATACA ACGCTATTTA ATAAAGACAG CAAAGCGGTT 540 

10 

AATGATGCGA TTGCTAAGCA GAAAAAAGAA CGACAACAAC AAATAAAAAA TGATATGTTT 600 

CAAAATCAAG CGAGTCACTC GACTCGCTTG AATGA 635 

(2) I NFORMATION FOR SBQ ID NO: 195: 

1S 

(1) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13715 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 195: 



25 


CTGAAATGGG 


TATTATTTGT 


CTTCTTCATC 


ATAAAGTAAT 


AAAGATTGTT 


CATCATTGCG 


60 




ACGTTGCCAA 


TTTTCATTTG 


GCGATCTTGG 


AACGTATAAT 


AATTGC CT AG 


TAGCATACGC 


120 




TTTGATTGAA 


ACATACAAGT 


CATTCCTTGA 


ACTTGCACCT CAATTTCCAC 


ATTTGAATTT 


180 


30 


TCTTTTATAT 


TAATAATTTC 


ATCCAAATTC 


AGCTCACGTG- 


CTAAGACAGC TCTTGATGCG 


240 




CCTCTTTTAC 


CCCAGTAATT 


ACATTGAAAA 


TGATTAGTTA 


CTAACGTCTC 


TGCATTCCAA 


300 




TGAAGTGGTA 


TTGGATTTTC 


TTGCGCCTTC 


ACATACATTA 


CTACTGCTGG 


ATCCCCGAAA 


360 


35 


ATAATTCTGT 


CAACT CGTAT 


TTCATGTAAA 


AAATTAATAT 


AATCTTCTAC AGCATCTAAA 


420 




TGATAATTAT 


GAAATAATCC 


ATTCACTGCC 


GCATATACTT 


TTTTATCGTT 


TTTGTGAGCT 


480 


40 


AATGCGACAG 


CCTCTGTCAT 


TTGTTGTCTA 


TTGAATTCCC 


CTGGAAGTCT 


TAAACCAAAC 


540 


TTTTGCTCGC 


CAATTACAAA 


AGCATCTGCA 


CCTAAATCAA 


TAAGTGTTTC 


CATATGGCTT 


600 




AATGACTTGG 


GTGTGACAAG 


TAATTCTGTC 


ATAGTCATTC 


TCCTTTAATT 


GAAATCGCTA 


660 


45 


ATCCATCGTC 


TATATTTAAA 


AAATTCGTTG 


TATATCCTGG 


TTGCTTTATT 


AACCACTCAT 


720 




TATAATCTTG 


AACCTTTTTA 


ACCATTTGTC 


TTACATTTCT 


CGATCTAACA 


ATCCCAATAT 


780 




CCGATACAAA 


ACCGTGATAT 


AAAACATTAT 


CTGTAATTAC 


GAGACCTTGG 


TGCTTTAAAA 


840 


60 


GTGGTGTATA 


TATTTCAAAA 


AATTTCTTTG 


ATTGCGCTTT 


TGCTGCATCA 


ATAAATATCA 


900 




TATCATAAAC 


TTTGTCATTT 


ACATTTTCAA 


ATTGCTCTAA 


AGCATTACCT 


TCAATAATTC 


960 
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CATTACGCTC 


TATCGTTGTG 


ACATGAATGT 


CATCAGATAT 


AGAAGCGAAT 


TGCATAGAAC 


1080 




TATAGCCGAT 


TGCTGTACCA 


ATTTCTAAAA 


TATTTTTAAC 


ATTATTCATA 


CGAATTAATT 


1140 


5 


GCTTAATTAA 


ATCTAATGTT 


AAACGATCTA 


CAATTGGCAC 


TTCATTTAC C 


TCGGCAAATT 


1200 




CACGCAAAAC 


TTCGATTGAA 


CTATTTTGAT 


GTTGATGTAA 


ATCTATTAAA 


TATTTTTTAT 


1260 




TTAGGTCATC 


CATGTTTTAA 


ACTTCCTTTA 


TGTAAAATAA 


GTCAATATGA 


TTATGACAAT 


1320 


10 


AAAATAAATC 


AGCCTTCACA 


ATTGATTATA 


ATTTTGCCAA 


CCAATTAAAT 


GACTGATTTC 


1380 




GTOTTAGACG 


CAAAGCTATT 


TTATTTATAG 


AAGCGAATCA 


TTCATATAAA 


ATTTAACTTT 


1440 


15 


AGATATTTTA 


CCATATTTTC 


AATAAAATTA 


TAAGCGTTAA 


TTATTTATAC 


ATTGCTTGAC 


1500 


TTAAAAAATA 


CTCTTGCCTC 


CCCATCTTTA 


AGGTTAGCAA 


GAGTAAAATC 


TTTTTAATTA 


1560 




TTCTTCCATT 


TCAGTATTTA 


CAACTTCTTC 


AATCATGTCC 


CATTCTTCAT 


CAGTTTCGAT 


1620 


20 


TGGTACTAAC 


TTACCACCGT 


CACCTGACTC 


ATCTGGTTCA 


TTGATCATTG 


GTACAAGCTC 


1680 


AATCATATCG 


TCTTCATCTG 


ATTGAGCACC 


TTCTTCAGCT 


AAGATAACAT 


ACTCTTTTTT 


1740 




GAATTCAGGA 


TGATAAAATT 


CTAAAACTTT 


TCGGTATAAA 


ACTTCATTTC 


CCTCTTCATC 


1800 


25 


GAATAAAGTT 


AATAATTCTT 


CTTCGTTATT 


AATTTCTAGT 


TGTGAAT CAT 


GATTATGTTC 


1860 




AGTCATAGTA 


AAATCTCCTT 


TTAATGTAGT 


GAATCTAAAT 


AGCCTTGTAA 


AATAAATACC 


1920 




GCTGCCATTT 


TATCAATCAC 


TTGTTTTCTT 


TTTTGTCTTG 


AAACATCTGC 


TTCTAATAAT 


1980 


30 


GATCGTTGAG 


CAGCCATTGT 


GCTTAATCTT 


TCATCCCACA 


TCACAATCTC 


AATAGAAGGA 


2040 




TAAGCTTCTA 


ataatttttc 


TTTATATGTT 


AACGAAGCTT 


CGCCTCGAAA 


TCCTATTGAA 


2100 




TTATTCATGT 


TTTTAGGTAG 


TCCTATTACG 


ACTGTACCCA 


CATTATGTTT 


TTTAATAATG 


2160 


35 


TCTAGTAATT 


GGTCAATACC 


TAATTCATTA 


TTTTCTTCAT 


TGATTCGGAG 


TGTGTCTAAT 


2220 




CCTTGTGCCG 


TCCAACCCAT 


TATATCACTA 


ATTGCAATTC 


CTACCGTTCT 


ACTACCGACA 


2280 




TCGAGTCCTA 


AAATTTTATG 


TTGTAACATA 


AATTATTTAT 


TTTGCTCTTT 


TAAATAGTAA 


2340 


40 


GAAACAAGCT 


CTTCCATAAT 


AACATCTCTA 


TCAATATGAC 


GAATTTGATT 


TCTTGCTTCA 


2400 




TTTTGGCGTG 


GAATATACGC 


AGGGTCACCT 


GATAATAAAT 


AACCTACAAT 


TTGGTTTACG 


2460 


45 


GCATTATATC 


CTCGTTCATC 


TAATGTTCGA 


TAAACATTAT 


TTAAAACATC 


TCTTACATCT 


2520 


TGCGTTGGAA 


GTTCTTCATA 


GTCGAATTTC 


ATTGTTTTAT 


CAAAGTTTTC 


CATTTGCGAC 


2580 




ACTCCTTTAA 


TTACAAATAT 


AACTCACTAT 


CATCATACAA 


TATTATGGCT 


TTAAATTATA 


2640 


50 


GATTTTTAAT 


GTAATCTTTA 


ATAAAGCTTA 


ATGATTTTGA 


GATATTTTCA 


GGTTGTGTAC 


2700 




CGCCACCTTG 


AGCCATATCT 


GGACGACCGC 


CACCTTTACC 


ACCAACGATT 


GGTGCCATTT 


2760 
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TCGATACTTT 


ATCATCAACA 


TTACTTGCAA 


GAATGATAAT 


TGTATCTTGT 


AGTTTAGATT 


2880 




TAAAATCGTC 


CATTGTCGAG 


CGAATTGCTT 


TCGCATTTGG 


TACATCCACT 


TCAGTAACCA 


2940 


s 


ATACTTTATA 


GCCATTGATT 


TCTTCAACTT 


GATCTTCAAT 


ATTACCCATT 


TTAAGTGATG 


3000 




TGATTTCTTT 


GTCACGTTGC 


TCTAATTGTT 


TTAATAATGC 


TTTTTCTTCA 


TCTTGTAATT 


3060 




GTGTTAACTT 


ATCGACTACT 


TGATCATCAG 


ATTTCACTTT 


CAGCTGTGAT 


TTCATCGTAT 


3120 


10 


TAAATTTCTC 


TTGAATATCT 


TCTAAATATA AGAAAGCTGC 


TTTACCTGTT 


AATGCTTCAA 


3X80 




TACOACGCAC 


ACCAGCTCCT 


GTACCTGACT 


CACTTACTAT 


TTTGAATAAG 


CCAATTTCAG 


3240 


15 


AAGTATTGCG 


GACATGAATA 


CCACCACATA 


ATTCAATTGA 


AAATGGTGCC 


ATATTTACTA 


3300 


CACGCACAAC 


ATCACCATAT 


TTTTCACCGA ATAATGCCAT 


TGCGCCCATT 


TCTTTAGcTG 


3360 




AAGCAATATC 


CATTTCTTGA 


ATGTTAACGT 


CAATACCTTT 


CCAAATTTCT 


TCATTTACTA 


3420 


20 


AGCGTTCAAC 


TTGATCAATT 


TCATCATTAG 


TCATTGGACC 


AAAATGAGAG 


AAATCAAAAC 


3480 


GTAAACGATC 


TGCTTC7TACT 


AGTGAACCAG 


CTTGGTTAAC 


ATGATCACCC 


AGTACTGATT 


3540 




TCAACGCTGC 


ATGTAATAAA 


TGTGTTGCAC 


TATGGTTCTT 


TTGAATGTCA 


CGTCGATCAT 


3600 


25 


TTTGGTTCAC 


TTCAGCAGAC 


ACTGTAGCGC 


CAACATTTAC 


TTGGCCAAAT 


TGTACTACTC 


3660 




CTTTATGCAA 


GTTTTGACCA 


TTTGGTGCTT 


TGGTTACTTC 


ACTAACAGCA 


ATTTCAAAAT 


3720 




TGTCATTATA 


AACAATACCT 


GTATCCGCAA 


CTTGTCGACC . 


ACTGATTGCA 


TAAAATGGTG 


3780 


30 


TTTCCGTTAA 


CATGAAGTAT 


ACTGTTTCAC 


CCGCTTCAAC 


TTGTGAAACT . 


TCTTCACCAT 


3840 




TGTATATCAA 


GTGTCTTAGT 


GTTGTTTGAG 


CtGTCGCAGT 


ATCATAACGA 


ACAAAAGTAC 


3900 




TTGCAGATGT 


AATATTTTTC 


AATACTTCAC 


TTTGAACTTG . 


CATTGATTGA 


GAATTTTGAC 


3960 


35 


GTGCTTGACG 


TGCACGATCA 


CGTTGTTGTT 


GCATTTCTGA 


CTCGAATGTT GTCATATCAA 


4020 




CTTCCAATCC TGCTTGCACT GCTATTTCTT 


CAGTTAATTC 


AATTGGGAAC 


CCATACGTAT 


4080 




CATACAATTT 


AAATGCATCT 


TTCCCATTAA 


TTTCATTTGT 


TGTCGCTTTA 


GCTTTTTTAA 


4140 


40 


TTAATTCATT 


TAAAATCGCT 


AAACCATCTT 


CTAATGTTTC 


ATGGAATCGT 


TCTTCTTCAG 


4200 




ACTTTATAAC 


ACGCTTAATG 


AAATCTGCTT 


TTTCCTTAAC 


ATTTGGATAA 


TATGGTTCCA 


4260 


45 


TAATGTCTGC 


AACAATATCA 


ACAAGTTTGT 


ACATAAATGG 


CTCATTGATT 


CCTAACGTTT 


4320 


GACTAAAACG 


AACGGCACGA 


CGTAACAATC 


GACGTAATAC 


ATACCCTCTA 


CCTTCATTGG 


4380 




CAGGTAATGC 


ACCATCAGAA 


ATTGCAAATG 


CAATCGTACG 


AATGTGGTCA GCAATTACTT 


4440 


50 


TAAATGCCAC 


ATCTTGTTCG 


TTGTTTACTA 


AATATTGTTT 


ACCTGATACT 


TTTTCGATTT 


4500 




CATTCATTAT 


AGG CAT AAAT 


AAATCTGTTT 


CATAGTTAGT 


ACGTACATTT 


TGAGAAACTG 


4560 
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TATGATCTTT ATTATGATTG AATTCACTAA ATACTAAGTT CCATACTTCA AGATAGCGTT 4680 

CATTTTCTCC ACCTGGATAC ATTTCTTCTG CCGGATCGTC TTGTCCATAT GCTTCTCCGC 4740 

5 GATCATAGAA AATCTCAGTG TTCGGTCCTG AAGGCCCTTC ACCAATATCC CAGAAGTTAC .4800 

CTTCAATGCG AATAATACGA CTTTCTTCAA GCCCAATATC TTTATGCCAA ATGTTGTATG 4 860 

CTTCCATATC TTCCGGATGA ATCGTAACGT ACAATTTATC TGGCTCCATA CCCATCCATT 4 920 

10 

TATCACTCGT TAAAAATTCC CAAGCAAATT CAATCGCTTC TTGTTTAAAA TAATCACCAA 4980 

TTGAGAAGTT ACCTAACATT TCAAAOAATG TATGGTGACG CGCTGTGAAA CCAACATTTT 5040 

CAATATCATT TGTACGAATA GCTTTTTGAG AGTTTACAAT TCTTGGCTTT TTAGGTGTTt 5100 

1S 

CACGTCCATC AAAATATTTC TTTAATGTTG CTACACCTGA ATTAATCCAT AATAATGTAT 5160 

CATCATCAAT TGGCACTAAT GGTGCAGAAG GTTCAACCAT ATGTCCTTTT TCAACAAAGA 5220 

AATCTAGATA TTTTTGTCTA ATTTCACTCG CTTTTAACTT TTTCATCATT TACACATCCT 5280 

20 

ATTTACTGTT TTTAAATTAC CATTCCATAA AAATTGATGA CACAGATAGT CGATTTGCAA 5340 

AACTAGTATA AATCAATATC ATTTTTTATT ATTAAAAAAT AAAAAACGCC CATCCTCAAA 5400 

2s AGGGACGAAC GTTATCGCGG TACCACCCTA GTTATAAATG CAATTCAACA CATTTATCAC 54 60 

TTTAATTCGA CTATACAGTT GTGCATAAAG TAG CGTTCAC TAATGTTTGT t GT ACTTTTC 5520 

ACCAACCAGT ACATCTCTGA TAAACAAATC aTTAACTACT CATCTTTATA CGAATTTAAT 5580 

30 TCTATTTTAG TTACATTTAC GCTTGTTGTC AACG TTCT AT AAAGTCATAC GGCGTGATTT 564 0 

CT CCCATATT AATCATTGGG TCAATTTTAA ACATTGT AG C TTCCGTTAAT ACATTTGTAT 5700 

CTGTTTTTGT TGAATCAGAC ATAACTTCTT CACTATCATT CGATGACATT GGCGCTTCTA 5760 

35 CTTGATCATC TATTGTCGTT TGTGAAGCTC CTGTATCATT AgTTGCTGTG TTTTCCAgCA 5820 

TTTCaTCATC TTCTGAATTA AAATAATTTT TCAACAATGT ACATAATTGT GTTAAACGCG 58 8 0 

CTTGACCATT TGTTTTCAAT CCAATATCAA ATGCTTCCGG ATCACCAAGT AAAACTAAAC 594 0 

40 

TCGTTTTCGC TCTAGTTAAA CCAGTATATA ATATCGGTCT TTGTAACATT CTAAAATACT 6000 

GTTTAACAAT AGGCATGATA ACAATAGGAA ATTCTGAACC TTGTGATTTA TGGATTGATG 6060 

TACAATAAGC ATGTGTTAAT TCCATCATAT CTTGTTTCGT AAATGTAATT TCATTACCTT 6120 

45 

CAAAATCCAC AACAAGTACA TCTTTATTAA GGGCATTTTC TTTCGCCCAA AAAATACCAA 6180 

CAATAACTCC TATGTCACCA TTGAATATGT TATCATTTGG CCTATTAACA AGTTGTAATA 6240 

60 CTTTGTCACC TTTT CT AAAG ACTACATCAC CAAACTCAAT TTCTCGTGTG TCTTTCTTTT 6300 

TAGGGTTTAA AATATCTTGT AAAACTTGAT TTAAACGTTT AATACCGGCA TTTCCTTTAT 6360 
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CTACCTTCTC AAGAACTGTT GGTATTTGQT TTGCCTGACA GTTAATAAAA CTTCTATCAT 64 80 

GAAAACGCTG TGTAATATCA ATTTTCTGAC CCAACTTCAT TCGATGTGCT AATTCTATAA 6540 

TGCTTGAACC ATCTTGTTGA CGATATACTT CAGTCAGATT TACTCGTGGT ATAGCTTTCG 6600 

ATTCAATTAA ATCTTTAAAT ACTTGACCAG GACCTACAGA AGGCAATTGG TCCTCATCAC 6660 

CTACAAATAT CAATTGTGCA TCTAAAGGAA CTGCACTTAA AAATTGGTGG AACAACCAAG 6720 

TATCTACCAT AGACATCTCA TCAATGATTA TGAGTCGTGC GTTTATTTCA TTTTCTAATA 6780 

TATCCTCTGG CTTTGTGTCT TGATTCCAAC CTATTAAACG ATGAATCGTC ATTGCTTCTA 6840 

ATCCAGTTGA CTCTTGTAGT CTCTTAGACG CTCTTCCTGT TGGCGCTGCT AATACAACTG 6900 

GATAATCATC ATTGACATAA TCATCATAAT CTAATGATAA GCCATGAATC TCAGCATATA 6960 

ATTCAACAAT ACCTTTAATT ACTGTCGTTT TTCCTGTTCC CGGTCCACCG GTTAATAGCA 7020 

TCACCTTAGA ATTGATAGCC GTTTGCAAAG CTTCTTTTTG TGAAGCTGCA TAGTTCACTT 7080 

GATTCGCATC TTCTATTTCA CCAATATGCA TTTGTAAATC TGACTGTTCA ATTTCTGTAA 7140 

GTTTATTTGT ATGCGTCTTT ATTCTGAATA AGTTTTGAAC ACTTTTGATT TCaGAATAAT 7200 

2s ACAAACTTGG AATTGCAACT TGTTCaTTGT CAATAATTAG TCGTTTTTCC TCATTTAAGT 7260 

ATTGCAACAT TTOGTCTAAT TTTTCAGGTT CGATGACCTC TTCATCTTGa TAATTTAATA 7320 

CATCAACCGT TAAATCTATA ACAACATTGA TAGGCAAATA TGTATGTCCC TGTTTAATAC 73 80 

30 ATTCTTCTTC TAACGTATAG AGCAACGCAG CTTTTAATCG TTCATTATCG TTATAAGCGA 7440 

TACCAATATT TCTAGCAAGT TGATCTGCTT TATTAAAACC AATACCTTTA ATATCATAAA 7500 

TCAATTGATA TGGATTTCGA TCTAAAATAG TCAGTGTATC GCCGAGATAA AA C TG AT AAA 7560 

TTGCCATTGA AAGTTTAGGA CCAAACCCTA AATCATGTAA ACGAATCATT ATTTTTTCAG 7620 

ATTCTTGATT TGCTGAAATT TGTTCTGCAA TTTGTTTCTG TTTCTTTTTA GATAATCCCG 76 80 

AAACTTTTTC TAGCACTGAA TGGTCATCTA ATATATCATT TATCGCATTG TCACCTAATG 7740 

TATTAACAAT ATTTTGAGCT GTCTTTTTAC CTACACCTTT AAACAAATCA CTAGATAAAT 7800 

AACTTATAAT TGCTTCTTTC GTTTGTGGCA TTTCTTTTTC AAAAGTCTCT GCTTTTAATT 7860 

GTTTACCATA ACGTGGATGA TCAACAACTT GCCCTTTAAA TGTGTAGACA TCGCCTTCAA 7920 

CAATATTCGG AAGAAACCCT ACAACAGTTG GCATTGTATC AAAGTCTTCA TTTGTTTCAA 7980 

TAGTATCTAC TTTAAGCACT GTATAAAAAT TATCACTGTT TTGAAACAAT ATCGCTTGAA 8040 

60 CAGTACCTTT GATCATTGAA TAATCAAATA GTGTAGGGTC TGACATGTTA CTCCTCCTCT 8100 

TTCATTTTAG TGAATGTTTT CAGCGCATGC TGACTTAATA AGTGTTTAGG GTCGATAGTC 8160 
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AAGCCCAAAT 


TGTATCTTGC 


ATCAACATGA 


TTTTTATCAA 


TCGTTAATAC 


ATGTTTAAGT 


3280 




TGAGTTATGG 


CTTCATTAAA 


CATTTCTAAT 


TGACATAATA 


CAAGACCATA 


TTGAAATTGA 


8340 


5 


ACTTCTGCAT 


CTTTGTCTTT 


ATCTAGTTCC 


GCAGCAGTCA 


TTAAATACGG 


CAATGCCAAG 


8400 




CTTAAATGAT 


TCTAACTGAT 


TAAACGCCAT 


ACCGATCATA 


TAATTACAAT 


CAACTTGTTC 


8460 


10 


AATCTCTGTT 


TGTAATGCTT 


GTTGATATAA 


TTTAATAGCT 


TCTTGATAAC 


GTTGCTGATT 


8520 


ATAATATACA 


TTTGCTAGAT 


TAAAAAATAC 


GACGCCATTC 


TTCGGATCTA 


TTGTnAAAGC 


8580 




TTTTTGGAAA 


AAACGCTCTG 


CCTTTyCAAy 


CyCATTCgCA TCAGCAAGTA 


OGATmCCaGC 


8640 


1S 


ATTAATATAA 


TTTTCAATAA 


TTGTAGGATT 


TTCTTCGATA 


TTTCCGAACA 


ATGCTTGTAA 


8700 


CGCTTCTTCT 


ATTTTTCCAT 


TTTGTATGTA 


TTGATAAATT 


GTTTGTTGAT 


CTATCATTTA 


8760 




CGAACCTCAT 


TTCTCATCAA 


TTATAACATC 


TTGATAAATT 


GTATGTCTCG 


AATCACTTAA 


8820 


20 


CAACGAATAA 


AATATAATCT 


AATATCATCT 


TCATTCATGA 


AAAAGCGGGA 


ATGGAATAGA 


8880 




AATGCTTAAG 


AACCATTAAC 


GGTTTATTAT 


GTAATGGTTC 


TTCCACATTA 


GCCACCACTA 


8940 




TTATGTACTT 


AAAAATAAGA 


ATACATAATT 


AGATTCATGC 


ATAGGGAGTG 


GGACAGAAAT 


9000 


2S 


GATATTTTAA 


CAAAATTAAA 


TTCGTTATCC 


CCAACTGGCA 


TTGCCTGTAG 


AATTTCTTTA 


9060 




CGAAATTCTC 


TATGTTGTGG 


TCCCGCCAAT 


ATAACATTGT 


AGAGCCTAGG 


ACATTGTGAT 


9120 




GTCCCAGACT 


CTATCCTCAT 


GAATTATTCT 


CATCAAAAAC 


TGTCTTTCGT 


CATTTTCAAC 


9180 


30 


GTTGAAACTT 


CAAATAAGTA 


ATTTATTGTT 


GCCATTGTTT 


ATACAACATA 


ATTTAATTGA 


9240 




CCTTCATTTT 


TGAACACATC 


GTCAATTGTT 


GCACCACCAA 


GACACACATC 


ACCTTGATAA 


9300 




AAAACAACTG 


CTTGTCCAGG 


TGTGATTGCT 


CTTACTGGCT 


CAGCAAAAGT 


AACACGTAGg 


9360 


3S 


CAtGG t CGTT TTCACGTTTC 


ACAAAAACTT 


TCGTATCTTT 


TTGGCGATAT 


CTAAATTTAG 


9420 




CTGtACATTC 


AAAACCTTGA 


TCTAAGTCAT 


TATCTTCTGG 


ATTTACAAAT 


GAATAGTCTG 


9480 


40 


AAGCAATTAA 


GTAATCACTG 


TATAATGCAT 


CGTGATGGAA 


TCCTTGTTCT 


ACATATAAAA 


9540 


CATTATCTTT 


TAGGTTTTTA 


CCGACAACAA 


ACCAAGGATC 


GCCATCTCCA 


CCTATACCTA 


9600 




ATCCATGTCT 


TTGTCCTATT 


GTGTAATACA 


TCAAACCACT 


ATGTTTACCC 


ATTTTCTTAC 


9660 


4S 


CATCAAGTGT 


TATCATATCA 


CCCGGTTGTG 


CAGGTAAATA 


TTGTGATAAA 


AATGTTTTAA 


9720 




AGTTTTTTTC 


GCCGATAAAA 


CAAATGCCTG 


TAGAATCTTT 


TTTCTTAGCA 


GTAACAAGTC 


9780 




CTTGTTCTTC 


AGCAATTCGA 


CGCACTTCAC 


TCTTTTCGAT 


GTCGCCAATT 


GGG aACATCA 


9840 


SO 


CTTTTGAAAG 


TTGTTGTTGA 


GATAATTGAT 


TCAAGAAGTA 


TGTTTGATCT 


TTATTATTAT 


9900 




CTACACCACG 


TAACATTTCA 


ACATGACCAT 


CTTCATGACG 


ATGTATGCGT 


GCGTAATGTC 


9960 
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20 



25 



30 



35 



40 



45 



SO 



TTTCTTTATT 
AATACGTAAA 
CAATTTGATT 
TTTCGTCAGT 
TTAAGACGTG 
TATCTTTATT 
CTACAATTGC 
GATTTGATCG 
CTGCTGTACA 
TCGTTTCAAC 
TTGAACCATT 
TTAAATTCAT 
TAGCCATCCC 
CACCGCCAAG 
CTTTTGGTCC 
ACTTAACATC 
CAGCAATAAT 
ACATraTAGa 
TAGCACCTGT 
CAAAAACATG 
GTTC&TTTGC 
TAAATATAAT 
CTAAATATTT 
AATTGTAAAT 
AATCTGCATA 
GCACCTTACA 
TATTTTACCA 
TTGTCTTTTT 
CTATTATTTT 



ACACATAACG 
GACTTTATCC 
ACACACTTCA 
GTCATCCCAG 
GGCTGTTACA 
TGACAATTAT 
ATTAATTTCA 
CTCCTCATCT 
TGCAGATCCA 
TTCAACAAAC 
TAATTCAAAT 
TAAATGAATA 
AACAATTTGC 
TTGAGGATAA 
GCCAAACTTA 
AAGATGTCCA 
ATCTTGAATA 
TACTAAAATC 
ATCATCAACA 
TAACACAGAA 
TTTTACTATG 
TTCATGTGTA 
ACGCGCATCT 
CGTCATCATC 
AATTTCCATG 
TACTATTTTT 
TTTTCTACAC 
TATAAATTTT 
GGTTATGAGC 



TCTGGATTTG 
CAATATTCTT 
ATAACATCGT 
TTTTTCATAA 
GAACTATCTA 
GACTCCTCCT 
TTTTCAGTAG 
TCGAACATTG 
GACGACACAT 
GGAAAATATA 
GGAATCGCTC 
TTGTTATCGT 
GCAAGATTTT 
TCTAGTGTAA 
TGAGCAGTAA 
ATTGCTTGAA 
TCATAAATTT 
GTCTTATCTG 
TCTAGATATG 
TGATGTTCAA 
CCTTTAATTG 
TCTGCACCAA 
CTTCCCTTAG 
GCATCTACTA 
TTTGGACACT 
CTACTTTTCT 
ATGCTTTTCG 
AGTATTTGCA 
AATTTAATAT 



GAGTACGACC 
TTTCAAAATT 
TGTAATCTTC 
ATATGCCAAT 
CACCGCCTGA 
TAAATTTAAA 
TCAATTCGTT 
CATCTAAAAC 
AGATTTGTGC 
GATTTACAAT 
TTTCTTGTAA 
CTCGATTCTT 
CAGTGCCTGC 
CATGGTCTTT 
TACTCATTGC 
CCGCATCAAC 
GTtGCACTGT 
tAATTGTTTC 
TTACATCAAA 
TCTTCGATGT 
CCGTATTATT 
GTAATTGTGC 
CATGTATTGA 
CTTCAGGTTT 
CCTCACAATT 
GTTTAACTTT 
ATAGGCTTTT 
GATATTTTTT 
TTATCTGGTT 



TTTTTTGTAT 
AACAGCGTAA 
AGTTGCAGTA 
GACATCATAA 
CATACCAACG 
ATATATTTTA 
AAAACTAAAT 
ATGCGACGGT 
CATATCCAAC 
ATGGCCTGTA 
TTTAACTAAA 
TTCTGCTAAT 
ACGGCGTTTC 
AACTAGTAAT 
GTCGATCTCA 
ATGGAAATAT 
GCCAaCTTCA . 
TTCAAGTTGA 
ACCTTCTCGC 
GATAATGTGA 
CGATTCTGTT 
AATTTGACGT 
TGATGGATTA 
TACTGGTGTG 
TTATCAATGT 
ATTTATAATG 
TTAAGTTTAT 
TATTTGTAAA 
ATTCGATTGG 



TCATCTAAGA 
TACGGAATGC 
CATACGCCAT 
CCTTGTTCTT 
ACAACACGTA 
TGAATTTCAG 
CGAATCGAAT 
TGTGTAGAGC 
AATGTTAACA 
GCATCCGTCA 
AATTGTTCTT 
TGTAATGCTT 
AATTCTTGTT^ 
GCACCGACAC 
AATTCGTCAA 
GCATTTGTCT 
TTATTTACAA 
TCTAAATCAA 
TCTAATTGTT 
TTACCCAATT 
GCGCCACTCG 
CTTGACTCAT 
CCATAATGCG 
GTCGCAGCAT 
TCCAATAATA 
TTTTTAATTA 
CGCTTTATTC 
ATGTAACGTA 
TATACTTCTT 



10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
106B0 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
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GTCCCTATTC GAGAAGGTGA AGATGAACAA ACAGCAATTA ATAATATOGT TAATCTCQCA 11880 

CAACATTTAG ACGAATTATC ATATGAAAGA TATTGGATTG CTGAACACCA TAACGCTCCC 11940 

S AACCTAGTAA GTTCAGCAAC TGCTTTATTA ATTCAACATA CGTTAGAACA TACGAAACAC 12000 

ATACGTGTAG GTTCTGGAGG CATCATGTTA CCTAATCATG CTCCATTAAT CGTTGCGGAA 12060 

CAATTTGGCA CGATGGCAAC ATTATTTCCA AATCGTGTCG ATTTAGGATT AGGACGTGCA 12120 

10 CCTGGAACAG ATATGATGAC CGcAAGTGCA TTAAGACGAG ATCAACATGA TGGTGTTTAT 12180 

AAATTTCCAG AAGAGGTTTC ATTATTACAA CAATATTTCG GCCCTGCTCA CCAACAAGCA 12240 

TATGTT CGTG CTTATCCAGC AGTAGGTAAA AATGTGCCTT TATACATTCT TGGTTCTTCA 12300 

15 

ACAGATTCTG CACATTT AG C TGCTCGCAAA GGGCTTCCAT ATGTGTTCGC TGGACATTTT 12360 

GCACCTCAAC AAATGAAAGA AGCTATCGAA ATTTACAAAA CGTTATTTGA AC CTTCTGAT 124 20 

GTATTAGACG AACCTTATGT TATTGTATGT TTAAATACAA TCGTTGCTGA AAATGATGAC 12480 

20 

GAAGCACAAT ATTTAGCTTC ATCTATGGCA CAAGTAATGG TTAGTATCAC TCGTGGCAGA 12540 

ATGCAGCCCG TTCAACCGCC AACACATGAA CTACAAAATA TATTAACGCC GAGAGAATAC 126 00 

2s GCGATGGCTA TGGAAAGACA GAAAATATCA TTAATAGGTT CAGAAAATAC TGTTCAACAA 12660 

AAAATTCAAG ATTTTATGGA AACTTATGGT GAAGTCAACG AAATTATGGC AATAAGTTAT 12720 

ATTTATGATA AAGATATGCA ATTAGACTCT TATCGTCGGT TCAAGAATGT TATAAATCAG 12780 

30 ATAAATGAAA AAAACACTTT ATAATGTGAT AAATAAACTA AGTGAAAGTA TGTATCCATA 12840 

ATATTAATAA AAATATACAG TAACAGCATT TTGAATGAAA GATGTCTTTA TTGTTCAATC 12900 

ATTTATTTTA GTAATGATTC AAATTCACTT AAAATyCTAA t GCAAATATG AAAGCGCCCC 12960 

35 TTCAcTTTAC ACTGTGTAAG TGTTTATTTG ATGGGGCGCT TTCAAAATAT TGAAAAGCAT 13020 

ATCCSAAATT TAAAGAAATT TATTTCTCTT TATCTTCATT TTCTTTTTTC TCTTCGTTAT 13080 

TCGATCCTGT ATATTCATTT AT CTT AT CTT TTACATTTTT AACTTGTTCA TTATCGCTAT 1314 0 

40 

TTTTAAATTT TTCTACGCGT CTTTAGCTTT ATC CAT AAAA CTCATATTAA TCGCTCCTCT 13200 

TATATTTGAT TAGTTTAATT GAACTTATTT TTTAAGTTTA TCAATTGCAT CAGTTATTTT 13260 

GTTTTTAGCA TTTTCAACAA CTTCTTTTGC TTTaCCAGTC GCTTTATCTT GCTGACCTTC 13320 

45 

TTTTTCTAAT TCTTTGTTAT CAGTAACGTT ACCTACTGTT TCTTTAACAT TTCCTTTAAA 13380 

TTGATCGAAC TtACTTTCGT CTGCCATAGT GAAACCTCCT TGGATGTATA TATTTATATA 13440 

SQ CCACTAAGGA GGTTCGCTmm mCAyymyAAT ATGAAGTTTT TATGTTATAG TATAGTATTT 13500 

ATACGATTAA ATATAAAACA TGTATCCGTC TAAATCTTCA CTTGTATCTA CATATTCCGC 13560 
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TAGTTGTTTT TGCGCAGGTG OTTCTGATTC AATACTTTCA ACAAATGTAA TTGGACCTTC 13680 
TAACAGTCTT ATAATATCCC CTGCTGAOAT TTCTT 13715 
5 (2) INFORMATION FOR SEQ ID NO: 196: 

(1) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 873 base pairs 

(B) TYPE: nucleic acid 
10 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 196: 

15 



20 



30 



AAATCCATAA 


TGTCATGATA 


ATCTGCATAT 


GCTTCATATA 


ATTCAATCAT 


TGTGAATTCA 


60 


GGGTTATGTC 


TAGTTGATAC 


ACCTTCATTA 


CGGAATACTC 


TACCAATTTC 


ATATACTTTT 


120 


TCAAGTCCAC 


CGACAATTAm 


ACGTTTTAAA 


TGCAACyCAA TAGCAATACG 


CATGTATAaC 


180 


GTTGCATCTA 


ATGCATTATG 


ATGTGTTACA 


AATGGTCTAG 


CAGCTGCTCC 


ACCAGCAATT 


240 


TGGTGCATCA 


TAGGTGTTTC TACTTCCAAG 


AAACCTTTAT 


TATTTAAATA 


ATTACGCATT 


300 


TCTTGAATGA 


TTTTACTACG 


ATTAATAAAT 


GTACGAGTGC 


TATCTTCGTT 


CGTAATTAAA 


360 


TCTAAATATC 


TTTGACGATA 


tCTCTGTTCA 


ATATCCTGTA 


AACCGTGOAA 


TTTATCCGGT 


420 


AATGGTCGCA 


ATGATTTAGT 


TAGTAGCGTG 


AATTTCTTCG 


CTTTAACCGA 


TAATTCGCCA 


480 


GTATTTGTTT 


TGAACATTAC 


ACCTTCAACA 


CCAACGATAT 


CGCCTAAATC 


AGCATTTTTC 


540 


CATAAATCAA 


ATTCGTCATC 


GCCAACTTGA 


TCTTTACGAA 


CGTAAATTTG 


AATTTGTCCA 


600 


GCTAAGTCCT 


GAACGTGTGC 


AAATCCTGCT 


TTACCTTTAC 


CACGCTTAGT 


CATTAATCGT 


660 


CCAGCTATAG 


CGACATGACT 


ATCCGCTTCT 


TTTTCTACCA' ATTCTTCTTT 


AGAATACTGG 


720 


TCCGACTCTT 


CTTTCAAATC 


ACTAGATAAA 


CCTGAACGGT 


CAAATTTAGA 


ACCAAACGGG 


780 


TCTATACCAA 


GATCATATAA 


TTCTTGTAAT 


TtTTGACGTC 


GAACCAACAT 


TTGGTCATTC 


840 


ATTTCTTCTG 


ACATAACTtT 


CTCTCCTTTA 


ACT 






873 



(2) INFORMATION FOR SEQ ID NO: 197: 

4S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 452 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

50 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 197: 
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ACCATAATAT GAATGGCTTC AGQATCAAAA TAAAGACCAA CTTCACTGCC TACTTCAGCT 120 

TTTTTAGTCG TTTGTATTAC CCATTCATAA CCTTTATTOT CTATACAACA TATTTCATAG 160 

TGGACCCCTC TAAATAACAT AGAATCAACA GTTGCTTTAA ATAATCCTTC TTCAGCTTTG 240 

ATTAATGATA TATCTTCTGG TCGAATAACG ACTTCTACTT TTTTATTTTC AGGAATACCC 300 

ATATCGACAC ATTCGAAATC TTGCCCATAA ATATTCACGA CATAATCTCT AACCATGCGC 360 

CCTTCAACAA TATTAGATTC TCCAATAAAA TCAGCTACAA ATCGATTCAC TGGTTCGTCA 420 

TaTATATCTG TTGGTGTGCC AAATTGTTGA AT 4 52 



(2) INFORMATION FOR SEQ ID NO: 198: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2308 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
on (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 198: 



25 


TAGGTTGGGT 


TCTAACATAC 


GATAAAGCTC 


AACAAATCAA 


CACAGCTTTC 


TTTGTAAAAT 


60 




TGTTTAATAC 


TGCATTAGCA 


GAACGTGATT 


ATTATTTTAA 


TATAGATGGA 


ACAAATGCTT 


120 




TT AGATT ATT 


TAATGCTGAA 


GGTGATGGTG 


TTGGGGGATT 


AACAATCGAC 


AATTACGATG 


180 


30 


GTCATTTGTT 


GATTCAATGG 


TACTCAAAAG 


GTATTTATAA 


ATTTAAATAT 


GCCATTCTTG 


240 




AAGCGGTTAG 


AAAAGTATTT 


GATTATAAAT 


CTATTTACGA 


AAAAGTAAGA 


TTTAAAGACA 


300 




GCGAATATAG 


TGGTGGTTTT 


GTTGAAGGAG 


ATGCACCTGa 


GTTTCCAATT 


GTTATCGAAG 


360 


35 


AAAACTTCAC 


ATTTTATAAT 


GTAGACCTTG 


AAGATGGTTT 


GATGACAGGT 


ATCTTTTTAG 


420 




ATCAAAAAGA 


AGTGCGCAAG 


AaATTAAGGG 


ATCAATATGC 


CAAAGAACGC 


CATGTTTTAA 


480 


40 


ACTTATTTAG 


TTATACAGGT 


GCTTTTTCTG 


CAATAGCAGC 


AAGTGAGGCA 


TCTTCAACAA 


540 


CAAGTGTAGA 


TTTGGCTAAT 


CGTTCTCGTA 


GTTTAACTGA 


AGAAAATTTT 


GGATTAAATG 


600 




CTATTGATCC 


TAAATCCCAA 


TATATTTATG 


TCATGGACAC 


TTTTGATTTC 


TATAAATATG 


660 


45 


CTGCACGACA 


TGGACATAGT 


TATGACACGA 


TCGTGATTGA 


TCCACCTAGC 


TTTGOGCGTA 


720 




ACAAAAAACG 


TACATTTTCA 


GTGCAAAAAG 


ATTATGACAA 


ATTAATTAAT 


GGCGCCTTAA 


780 




ATATCTTATC 


ATCTGAAGGA 


ACATTATTGT 


TATGTACAAA 


CGCAAGTGTA 


TATCCATTAA 


840 


50 


AGCAATTTAA 


AAATACTATT 


AAAAAGACGC 


TTGAAGAGAG 


TGGCGTTGAT 


TATGAATTAA 


900 




CTGAAGTTAT 


GGGATTACCA 


AAAGATTTTA 


AAACGCATCC 


ACATTATAAG 


CCATCTAAAT 


960 
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5 



10 



1S 



20 



35 



TATTGAGAAA 


AAGAAGGGTG 


ATAATATTAT 


GGGATTCAAA 


AAUAAJ. 1 1 AA 




1080 




ATCGGTAATT 


CAGTCTTTAA 


AATAGAAAAT 


GTTGACGGAA 


AAuu iuLAAi 


1140 


/-i /-»/-♦ jk J\ jk fy^t 

O L. CAAwUACG 


ATTCAAGAAT 


TGAGAGAAAG 


ACGACAACGT 


GCTGAAGCAA 




1200 


AAAGTCTTTA 


ATGTCATCAA 


CAATGAGCGT 


TGTTCCAATT 


CCGGGTTTAG 


ATTTTGGTGT 


1260 


TV* T\ T*T^* ^ ft » IV 

TGAll iAAAA 


M MM «k «k Ik J"« 

TTAATGAAAG 


ATATTATCGA 


AGATGTTAAT 


AAAATTTATG 


GTTTAGATCA 


1320 


TAAGCAAGTT 


AATAGCCTTG 


GGGATGATGT 


GAAAGAAAGA ATTATGTCTG 


CAGCAGCAAT 


1380 


TCAAGGTAGT 


CAATTTATTG 


GTAAAAGAAT 


1 ILAAA l\r<JA 


TTTTTAAAAA 


TTGTAATTAG 


1440 


AGATGTAGCT 


AAACGTACTG 


CTGCAAAACa 


aagaaaatgg 


TTTCCTGTTG 


TaGGACAAGC 


1500 


TGTGTCTGCA 


TCTATTAGTT 


ACTATTTTAT 


GAATaAAATT 


GGAAAAGATC 


ACATTCAAAA 


1S60 


ATGCGAAAAT 


GTTAT7AAAA 


ATGTCATGTA 


ggtgctataa 


TAGTTTTGCA 


ATTTGCAAAT 


1620 


TTTACTGAAA 


CCGGTTTTAA 


ACGAATTGAA 


TTTAAAGcAT 


GuI"i"X"i\SGTA 


AAGTTAATGT 


1680 


ATAAAACTAA 


GTTAGyATTG 


TAATAATATk 


GAAGATTCTA 


ACTATACGAA 


GGAGAAATGT 


1740 


AATTATGGAA 


CAAAATTCAT 


ATGTAATCAT 


CGACGAGAmT 


GGTATTCACG 


CTAGACCAGC 


1800 


AACAATGTTA 


GTACAAACAG 


CTTCAAAATT 


CGATTCTGAT 


ATTCAATTAG 


AATATAACGG 


1860 


TAAGAAAGTA 


AACTTAAAAT 


CAATCATGGG 


TGTTATGAGC 


CTTGGTGTTG 


GTAAAGATGC 


1920 


TGAAATTACA 


ATTTATGCTG 


ACGGTAGTGA 


TGAATCTGAC 


GCCATTCAAG 


CAATCAGTGA 


1980 


CGTCTTATCA 


AAAGAAGGAT 


TGACTAAATA 


ATCATGTCTA 


AATTAATTAA 


AGGTATTGCC 


2040 


GCATCTGATG 


GTGTCGCAAT 


TGCTAAAGCT 


TATTTATTAG 


TTGAGCCAGA 


CTTAACATTC 


2100 


GACAAAAATG 


AAAAAGTCAC 


TGATGTTGAA 


GGAG AAGTTG 


CAAAGTTCAA 


TAGCGCTATC 


2160 


GAAGCTTCTA 


AAGTTGAGTT 


AaCTAAAATT 


AGAAATAATG. 


CAGAGGTTCA 


ACTAGGTGCT 


2220 


GATAAAGCTG 


CTATCTTTGA 


TGCAcaTTGG 


GGGGTGGTAG 


ATGACCCTGA 


ATTAATTCAA 


2280 


CCAATCCAAG 


ATAAGATTAA 


AAATGAAA 








2308 



40 

(2) INFORMATION FOR SEQ ID NO: 199: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5559 base pairs 
. (B) TYPE : nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



SO (xi> SEQUENCE DESCRIPTION: SEQ ID NO: 199: 

AAGTAATAAA TCGTCTCATT TGGCAACTGA CGCATAATTT CTTTAGCTAC TGTCAAACCT 60 
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TTTAATTTTT 


AGTTTATCAT 


AACTAAGCAT 


TGGATTTTAG 


TATTATGCAC 


TGTGTTTACC 


180 




ATTTTTGTCA 


TTATAATATT 


TATTTTAAAT 


CAGCCCACTA 


TCATATTGTC 


ATGTAATCTG 


240 


s 


CTTATTAAAA 


AAATCCCTTC 


CAAGTTATTG 


TGTATCTCCA 


TTCAATTTAA 


TTTTGAAAGG 


300 




AACATAACwT 


TTTAACTCAA 


AAGGGATTAA 


TTTnTAnTCT 


ACTTCATGGT 


CTGAACCAAA 


360 




GAATGATTTA 


AACATGTGGA 


ATGTTGTTTC 


TCTGTTCATT 


GCTGCAATGG 


ATGTTGTTAA 


420 


10 


TGGAATACCT 


TTAGGGCAAG 


CATTAACACA 


GTTTTGTGAA 


TTACCACACT 


GCTGTAAGCC 


480 




ACCAGTACCC 


ATTAATGCAT 


TTAAACGTTC 


ATCTTTAGTC 


ATAGATCCTG 


TTGGGTGCAA 


540 


IS 


ATTAAACAAA 


CGAACTTGCG 


AGATTGCTTG 


TGCACCAACG 


AaTTTATTAT 


TTTCAGTAAC 


600 


ATTAGGACAA 


ACCTCTAAAC 


ATACACCACA 


TGTCATACAT 


TTAGATAATT 


CATAAGCTGT 


660 




TTGACGTTTT 


TTCTCTGGCA 


TACGTGGTCC 


CGGACCTAAA 


TCATACGTTC 


CATCAATTGG 


720 


20 


GATCCATGCT 


TTCATACGTT 


TTAAGTTATC 


GAACATTCTA 


GAACGATCAA 


CTTGTAAGTC 


780 


ACGGATAACT 


GGGAAAGTAT 


TCATTGGCTC 


TAAACGAATA 


GGTTGTTCTA 


ATTGATCAAC 


840 




AATCGCAGAA 


CAAOATTGTC 


TTGCACGACC 


ATTGATAACC 


ATAGAACATG 


CTCCACATAC 


900 


25 


TTCTTCTAAG 


CAGTTCATAT 


CCCAGACAAC 


AGGTGTTGTT 


TTTTCACCTT 


TAATATTAAC 


960 




TGGGTTACGT 


CTAATTTCCA 


TTAAACAAGC 


AATGACGTTT 


AAATTTTCAC 


GATATGGAAT 


1020 




TTCAAATGTT 


TCTTCATAAG 


GCTTAGAATC 


ACTTGTATCT 


TOTCGTTTAA 


TAATTAATTT 


10B0 


30 


TACnXSTTTTT 


TGTTTCGGTT 


TAGATTGTGT 


TTCATGTTGT 


GGAGTGTTTT 


TCACTGATTG 


1140 




TTCAGTCATT 


ATTTTTTACC 


CC CTTTAG AC 


TTACTTGTGT 


AATCACGTTT 


ACGAGGTGGT 


1200 




ATTAAAGTCA 


CATCG ACGT C 


ATCATAAGTA 


AACTGCGGTT 


TTTCAAATGC 


GCCTTGGAAT 


1260 


35 


GAGGGGATTG 


TCGTTTTTAA 


CCACTCTTCA 


TCATTACGCT 


CTGGGAATTC 


TGGTTTATAA 


1320 




TGGGCACCX3C 


GTGATTC GTT 


ACGGTTATAT 


GCACCAATCG 


TAATAACACG 


TGCAAGTACT 


1380 




AACATGTTCC 


ATAGTTGACG 


GGTAAAGAAT 


ACCGCTTGGT 


TACTCCAAGT 


TTGAGTATCT 


1440 


40 


TCCATATCAA 


TATCTTCATA 


ACGTTTCATC 


AATTCAACAA 


tctttttatc 


TGTTTCTAAC 


1500 




AGTTTTTCAT 


TTTCACGAAC 


AACAGTTACA 


TTTGCTGTCA 


TAATTTCACC 


AAGTTCACGG 


1560 


45 


TGTAATTTAT 


ATGCATTTTC 


TGTACCGCGC 


ATAGCTAATA 


ATTTATCAAA 


ACGTTCTTGC 


1620 


TCTTCAGCTT 


TACGCTTTTC 


AAAAATACTT 


TCGTCCATAT 


CAGTATATGA 


TCGATCAATA 


1680 




TTTGAAATAT 


AATCAATCGC 


GTTTGGACCT 


GCTACTGTAC 


CACCATAAAT 


CGCTGATAAC 


1740 


50 


AATGAATTGG 


CACCTAAGCG 


GTTACCACCA 


TGTTGAGAGA 


AGT CACATTC 


TCCAGCTGCA 


1800 




AATAACCCTT 


TAATATTTGT 


CATTTGATCA 


TAATCTACAT 


AT AG ACCAC C 


CATTGAATAG 


1860 
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TAAATCTCAA 


TGATACCACC 


TAGTTTTACA 


TCTAACTCAT 


GTGGATCTTT 


ATGTGACAAA 


1 QRO 




TCAAGATATA 


CCATGTTTTC 


GCCATTTATA 


CCTAATTTTT 


GGTTAATACA 


TACATCGAAA 




5 


ATTTCACGCG 


TTGCGATATC 


ACGAGGTACT 


AAGTTAC CAT 


AATCAGGATA 


TTTCTCTTCT 


5 1 on 




AAGAAGTACC 


AAGGCTTACC 


ATCTTTATAT 


GTCCAAATTC 


GTCCACCTTC 


ACCACGTGCT 


^ i fin 




GATTCACTCA 


TTAGTCGCAG 


TTTATCATCA 


CCAGGGATTG 


CAGTAGGATG 


AATTTGAATG 




10 


AACTCACCAT 


TAGCATAAAT 


«l>W\«WW\a X X *J X 


TGGTAAACAA 


TGGAAGCGGC 


TGATCCTT3TA 






TTAATCATTG 


SVJt X X X VJ A X w A 


TTTACG3AAA 


ATAATAPPAH 


WWWlUVrW X 


TCPPATA ATA 




1S 


ACTGCATCTG 


AACCAAATGT 


TTCAATOTP2A 


rjr , AnTTfyrr , A 

VV^Vi? X X V7 X V>£% 


XnX X X X VJlUVt 


AnPOATAPPT 


"> A A rt 


f^TTYJfTA PTAT 


C ATTYrrf a hp 


X 1 lnlu 


ff*A Af^/IA ATT 


LVLniUL 1 XT^ 


ft T ft rTTCY^T ft 

AXAVX X L.VjX A 


2460 






OTB PTTP ft A 


TYlPHPrTlft. ftrT 


TfJTTPATPPA 


ATflTATATA ft 


TAATTGTTGT 


2S20 


20 


. N»SJvJ A XVJ 1 1VJ 


pppptyip ata 

V^V-V^C XVJlJAX A 


TGOTGTTCTG 


TfATPTa TVS 


T A fV^ & f*ff* & A 
1 ALLAL CvjAA 


ft PPTi'»l' ft ft ft ft 

AtA»X AAAA 


2580 




X A» 1 AAiAUAL 


CTTCATTTGT 


IVlAi XVaAAC 


Al 1ACGCCCA 


n*ft ^"V5^"T*^"» r PlV ft 

TAwGGTvTAA 


IflK ft ft fTvl ft. ft «Tv ft 

TaaaTGAATA 


2640 




ATTTTAGGTG 


CTGCCTCTGT 


CATCGCTTTA 


ACAGGTGGTT 


GGTTTGCAAG 


GaAATCGCGA 


2700 


2S 


L.(JA I AC-Av~ X a> 


TATCATCAAA 


/snVl IV ik rn/*vift ft 

GTGAATCGAA 


GGAGAATCGC 


CTTCCCCTTT 


AGTATTGACC 


2760 






TGCCACCTTG 


/•lO/ 1 ! ft /"Vft. 9% ft. ft 

GGCACAAAGA 


^* IV / lift/ ft. ft. 

GAGTGCGAAC 


GCTTTACTGG 


TACAACTGAG 


2820 




ftTV— I'ft 


CATGTGCAt C 


TTTTTCTGCC 


GCTTTAATTG 


iiaiV* ji f|«|i ft ft 

TTGACATTAA 


GCCCGCTAGG 


28B0 


30 


La_A\_W X \,VAjA 


PMl/'li ft»T*ft. ft/""* 

LAALAATAAvj 


ATGTTTCTCT 


GCCATAAAAA 


. TTTCACTCCC 


CTAAATTTTC 


2940 




AA1L1A1A1 1 


ITj 1 1 AAA X 


(jAluiAl I AC 


ATAAAGGCAA 


TAATTBCAGT 


AACACCZAATA 


3 000 




T A f*Y^ 2k A & T A & 


l_XAAAAAX Aw 


^hTTfc ftTV^ft ft 


ft r*f*c* ft ovt r a 
ALLLAlulAA 


ft *T* ft PTPPTTY^ 

A1AL X tA» X Xvj 


TGATTTTGGA 


3 060 


35 


fiATTYiAAfypf 

Unl XVaMauXL 


UiLLCWvtU X 


* ft/^Tft ftr^ft a T 


UAL(JilAAvV. - 


raTTTYva ft ft 
V~AX ilvLAnn 


^ ft ft ft /"» ft. 


3 120 




ACAGPAATAA 




ATAAAATATT 


(^PPPATPPAfl 




lUl X X V^VJ 1 VjV, 


11 on 




ATTAAATOGT 






^Vrt X VJV» X X X X X 


fiTAAApfiTOT 


TTriPPATAA 
X lVj^.v^iinnn 




40 


TGGATACCAA 


TAAAGATAAA 


TGTTAAGATA 


CCACTCACTC 


'PTTfirtA AAAA 

XXX r tt L \ T ffc/a 


GAAPATPPAfi 


linn 
JJuU 




TTTCTAAAAA 


TCGAGTAATG 


TCCAACATTT 


TCTTTTGCTC3 


TAAATGCAAT 


X w X^% X<AWW^% 


JJOU 


45 


AACAAACCGT 


GATATAACAA 


CGGAATGTAT 


ATAAATAAAA 


ATTCTACAAT 


AATTAGAAAT 


3420 


GGTAATGATT 


CCATAAAGTT 


AGATGCCTTA 


TTAAACGCTT 


CAGCACCTTG 


TGTTGCTTGG 


34B0 




TGATTCACTA 


ATAAATGAAC 


GACCAAAAAT 


GCACCTATTG 


GGATAATACC 


TAATAACGAG 


3S40 


50 


TGAATACGTC 


TTAGATAAAA 


TTCATriTl-r 


GATTGAGCCA 


AAAGGAGTCC 


CCCCTGTGAA 


3600 




CGAATATTTA 


ATTTATTGAG 


CTATTTATAT 


TAAACGTACG 


CTTAACCCCC 


TAAAGTGATA 


3660 
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CGATCACCAA ACTGCATGTC GAACAATGTA ACATTTGGAT TCOATATTTA AAATTGCTTG 3780 

TGATGATAAA CTTTCTCATT TAGAAAACGC TTCCACGTAC ATTCAAAAAA ATAACTTTGT 3840 

TAACCATATT GTAACATTAT TTCATATATT TTGGGGCATG AGAATGATTC TCACGCCCAG 3 900 

TAATTTATTT ATCCAATTGT TCATGTAGGT TCTTTGCGAC GTTTTCAGGA ATACCTATAT 3960 

TTTTAAAATC TTCAAGTGTA GCTTCCTTCA TTTTCTTGAT TGAACCGAAT GAACGCAATA 4020 

ATAATGTTTT ACGTTTGTTA CCGATACCAT CTATATCATC AAGTATTGAT TTCAAGCCTG 4080 

TCTTTTGACG TGTTTGTCTA TGAAATGTGA TTGCGAATCT GTGAACCTCA TCTTGGATAC 4140 

GGTGCAACAA ATAAAATGCC. TGGCTATTTT TCTTCAGTGG TACAATTTCT GCACTAGCGC 4200 

CATATAATAA TTCAGATGTT TGGTGTTTAT CATTTTTCTG CAAACCTGCA ACAGGGATAT 4260 

CAAGACCTAA TTCGTTTTGT AGCACATCAA TAACCCCGTT CATATGTCCT TTACCACCAT 4320 

CTACTATTAT TAAATCAGGT AATGGTAATC CTTCGTTTAA AACGCGAGAA TATCGTCGTC 4380 

TTACTACTTC TCTCATTGAT TTGTAATCAT CTGGACCTTT AACCGTTTTG ATTTTATACT 4440 

TTCTATAATT TTTCTTATCT GGTTTACCGT CGACAAATGT AACCATTGCT GACACTGGAT 4500 

CCACACCTTG AATATTAGAA TTATCGAATG CTTCAATTCT AATTGGTGTT TGAATTCCCA 4560 

TTTGTGTTCC AAGTTCTTCA ATAGCTTTAA TCGTTCTGGA CTCATCACGT GATATTAATT 4620 

CAAATTTATT ATTTAAGGAT ACTTTAGCGT TATGTGCAGC TAGGTCAACC ATATCTTTTT 4680 

30 TGGGACCTCG CGCGGGTTGA ACGATTTTAG TGTC CACAAC AGATTGAATC ATTTCTTTAT 4 74 0 

CCAAATTACG TGGTACATGA ACTTCCTTAG GTAAAATATG TTGGTTTAAG CTATAAAATT 4800 

GTCCAATAAA TGTATAAAAT TCTTCTTcTT CTGTTTGCTG TAATGGAATC ATCGTTGTAT 4860 

35 CTCGCTTTAT CATATTACCT TGTCGTATAA AGAAAACTTG GATACACATC CATCCTTTAT 4 920 

CAACACTATA ACCAAAGACA TCACGAATCG TTTTATCTGA TGACATAATT TTTTGTTTGT 4980 

TTGTCAGATT TTGAATATGT TGAATTAAAT CTCTATATTC TTTAGCCCGT TCAAAATCAA 5040 

GTGATTCACT TGCAGTTAAC ATTCGCTCTT CTAAACTTTT TAAAATTGTT TTGTCTTCCC 5100 

CATTCAGAAA ATCAGTAATT TCCTTCGTCA TTTGTGCGTA TTTACTCAAA TCAACGTCAT 5160 

ATACACATGG TCCTAAACAT TGTCCAATAT GGTAATAAAG ACATAATTTA TCTGGCATCT 5220 

TATCACATTT GCGATATGGA TATATTCTGT CTAATAACTT TTTAGTTTCT TGAGCAGAAT 5280 

ATG CATTCGG ATACGGTCCG AAATATTTGC CAGTACCTTG TTTTACAGTT CTCGTCACTA 5340 

GTAGTCTAGG ATATTTCTCC TTCGTAATTT TAATAAATGG ATAACTTTTA TCATCCTTTA 5400 

ATAATATATT ATATCTTGGT TGATATTGTT TAATCAGATT CAATTCCAGT AAAAGTGATT 5460 



10 



15 



20 



25 



40 



45 
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TTTTAOCATC ATGAGCACCC GTAAAATATG ATCGCAATC 5559 
(2) INFORMATION FOR SEQ ID NO: 200: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4594 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNBSS : double 

(D) TOPOLOGY: linear 

10 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 200: 



rs 


AAATCAATCG 


AGTGGCATGT 


CAAGGTCATA 


TCAATATTTT 


AGAATCTGCG 


ACTATGAGAG 


60 




AGGAAATAAA 


TGAAATTGCG 


CGACGTATCA 


TCGTTGATAT 


TCGTGATAAG 


CAATTACGAT 


120 




ATCAAGATAT 


TGCTATTTTA 


TATCGTGATG 


AATCTTATGC 


TTATTTATTT 


GATTCCATAT 


180 


20 


TACCGCTTEA 


TAATATTCCT 


TATAATATTG 


ATACAAAGCG 


TTCGATGACA 


CATCATCCGG 


240 




TCATGGAAAT 


GATTCGTTCA 


TTGATTGAAG 


TTATTCAATC 


TAATTGGCAA 


GTGAATCCAA 


300 




TGCTACGCTT 


ATTGAAGACT 


GATGTGTTAA 


CGGCATCATA 


TCTAAAAAGT 


GCATACTTAG 


360 


25 


TTGATTTACT 


TGAAAATTTT 


GTACTTGAAC 


GTGGTATATA 


CGGTAAAOGT 


TGGTTAGATG 


420 




ATGAGCTATT 


TAATGTCGAA 


CATTTTAGCA 


AAATGGGGCG 


TAAAGCGCAT 


AAACTGACCG 


460 




AAGATGAACG 


TAACACATTT 


GAACAAGTCG 


TTAAGTTAAA 


GAAAGATGTC 


ATTGATAAAA 


540 


30 


TTTTACATTT 


TGAAAAGCAA 


ATGTCACAAG 


CGGAAACTGT 


AAAAGATTTT 


GCAACTGCTT 


600 




TTTATGAAAG 


TATGGXATAT 


TTCGAACTGC 


CAAATCAATT 


GATGACAGAG 


CGAGATGAAC 


660 


35 


TTGATTTAAA 


TGGTAATCAT 


GAAAAGGCGG 


AGGAAATTGA 


TCAAATATGG 


AATGGCTTAA 


720 


TTCAAATCCT 


TGATGACTTA 


GTTCTAGTAT 


TTGGAGATGA 


ACCAATGTCG 


ATGGAACGTT 


780 




TCTTAGAAGT 


ATTTGATATT 


GGTTTAGAAC 


AATTAGAATT 


TGTTATGATT 


CCGCAAACAT 


840 


40 


TGGACCAAGT 


AAGTATTGGT 


ACGATGGATT 


TGGCTAAAGT 


CGATAATAAG 


CAACATGTTT 


900 


ACTTAGTAGG 


TATGAATGAT 


GGAACGATGC 


CACAACCAGT 


AmTGCGTCAA 


GCTTGATTAC 


960 




AGATGAAGAA 


AAGAAATACT 


TTGAACAGCA 


GGCTAATGTC 


GAGTTAAGTC 


CAACATCAGA 


1020 


45 


TATTTTACAG 


ATGGATGAAG 


CATTTGTTTG 


TTATGTTGCT 


ATGACTAGAG 


CTAAGGGAGA 


1060 




TGTTACATTT 


TCTTACAGTC 


TAATGGGATC 


AAGTGGTGAT 


GATAAGGAGA 


TCAGCCCATT 


1140 




TTTAAATCAA 


ATTCAATCAT 


TGTTCAACCA 


ATTGGAAATT 


ACTAACATTC 


CTCAATACCA 


1200 


SO 


TGAAGTTAAC 


CCATTGTCAC 


TAATGCAACA TGCTAAGCAA 


ACCAAAATTA 


CATTATTTGA 


1260 




AGCATTGCGT 


GCTTGGTTAT 


ATGATGAAAT 


TGTGGCTGAT 


AGTTGGTTAG 


ATGCTTATCA 


1320 
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GTTTGACAAT 


GAAACTGTAA 


AATTAGGTGA 


AACGTTGTCT AAAGATTTAT 


ATGGTAAGGA 


1440 




AATCAATGCC 


AGTGTATCCC 


GTTTTGAAGG 


TTATCAACAA TGCCCATTTA 


AACACTATGC 


1500 


5 


GTCACATGGT 


CTGAAACTAA 


ATGAGCGAAC 


GAAGTATGAA CTTCAAAACT 


TTGATTTAGG 


1560 




TGATATTTTC 


CATTCTGTTT 


TAAAATATAT 


ATCTGAACGT ATTAATGGCG 


ATTTTAAACA 


1620 




ATTAGACCTG 


AAAAAAATAA 


GACAATTAAC GAATGAAGCA TTGGAAGAAA TTTTACCTAA 


1680 


10 


AGTTCAGTTT 


AATTTATTAA 


ATTCTTCAGC 


TTACTATCGT TATTTATCAA 


GACGCATTGG 


1740 




CGCTATTGTA 


GAAACAACAC 


TAAGCGCATT AAAATATCAA GGCACGTATT 


CAAAGTTTAT 


1800 


IS 


GCCAAAACAT 


TTTGAGACAA 


GTTTTAGAAG 


GAAACGAAGA ACAAATGACG AATTAATTGC 


1860 


ACAAACATTA 


ACGACAACTC 


AAGGTATTCC 


AATTAATATT AGAGGGCAAA 


TTGACCGTAT 


1920 




CGATACGTAT 


ACAAAGAATG ATACAAGTTT TGTTAATATC ATTGACTATA AATCCTCTGA 


1980 


20 


AGGTAGTGCG 


ACACTTGATT 


TAACGAAAGT 


ATATTATGGT ATGCAAATGC 


AAATGATGAC 


2040 




ATACATGGAT 


ATCGTTTTAC 


AAAATAAACA 


ACGCCTTGGA TTAACAGATA 


TTGTGAACCA 


2100 




GGTGGaTTAT 


TATACTTCCA 


TGTACATGAA 


CCTAGAATTA AATTTAAATC 


ATGGT CTG AT 


2160 


25 


ATTGATGAAG 


ATAAACTAGA 


ACAAGATTTA 


ATTAAAAAGT TTAAGTTGAG 


TGGTTTAGTT 

i 


2220 




AATGCAGACC 


AAACTGTTAT 


TGATGCATTG 


GATATTCGTT TAGAACCTAA 


ATTCACTTCA 


2280 




GATATTGTAC 


CAGTTGGTTT 


GAATAAAGAT 


GGCTCTTTGA GTAAACGAGG 


CAGCCAAGTG 


2340 


30 


GCAGATGAAG 


CAACGATTTA 


TAAATTCATC 


CAACATAAGA AAGAGAATTT 


TATAGAAACA 


2400 




GCTTCAAATA 


TTATGGATGG 


ACATACTGAA 


GTTGCACCAT TAAAGTACAA 


ACAAAAATTG 


2460 




CCATGTGCTT 


TTTGTAGTTA 


TCAATCGGTA 


TGTCATGTAG ATGGCATGAT 


TGATAGTAAG 


2520 


3S 


CGATATCGAA CTGTAGATGA AACAATAAAT 


CCAATTGAAG CAATTCAAAA 


TATTAACATT 


2580 




AATGATGAAT TTGGGGGTGA GCAATAGATG ACAATTCCAG AGAAACCACA 


AGGCGTGATT 


2640 


40 


TGGACTGACG 


CGCAATGGCA 


AAGTATTTAC 


GCAACTGGAC AAGATGTACT 


TGTTGCAGCC 


2700 


GCGGCAGGTT 


CAGGTAAAAC 


AGCTGTACTA 


GTTGAGCGTA TTATCCAAAA 


GATTTTACGT 


2760 




GATGGCATTG 


ATGTCGATCG 


ACTTTTAGTC 


GTAACGTTTA CAAACTTAAG 


CGCACGTGAA 


2820 


45 


ATGAAGCATC 


GTGTAGACCA 


ACGTATTCAA 


GAGGCATCGA TTGCTGATCC 


TGCAAATGCA 


2880 


CACTTGAAAA ACCAACGCAT 


CAAAATTCAT 


CAAGCACAAA TATCTACACT 


CCATAGTTTT 


2940 




TGCTTGAAAT 


TAATTCAACA 


GCATTATGAT 


GTATTAAATA TTGACCCGAA 


CTTTAGAACA 


3000 


50 


AGCAGTGAAG 


CTGAAAATAT 


TTTATTATTA 


GAACAAACGA TAGATGAGGT 


CATAGAACAA 


3060 




CATTACGATA 


TCCTTGATCC 


TGCTTTTATT. GAATTAACAG AGCAATTGTC 


TTCAGATAGA 


3120 
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AATCCTACAA ATTGGTTGGA TCAATTGGTG ACACCATACG AAGAAGAAGC ACAACAAGCG 3240 

CAACTTATTC AACTACTAAC AGACTTATCT AAAGTATTTA TCACAGCTGC TTATGATGCT 3300 

S TTAAATAAGG CGTATGATTT GTTTAGTATG ATGGATAGCG TCGATAAACA TTTAGCTGTT 3360 

ATAGAAGATG AACGACGTTT AATGGGGCGT GTTTTAGAAG GTGGCTTTAT TGATATACCT 3420 

TATTTAACTG GTCACGAATT TGGCGCGCGT TTGCCTAATG TAACAGCGAA AATTAAAGAA 34 80 

10 GCAAATGAAA TGATGGTCGA TGCCTTAGAA GATGCTAAAC TTCAGTATAA AAAATATAAA 3540 

TCATTAATTG ATAAAGTGAA GAGTGATTAC TTTTCAAGAG AAGCTGATGA TTTGAAAGCT 3600 

GATATGCAAC AATTGGCGCC ACGAGTAAAG TACCTTGCGC GTATTGTGAA AGATGTTATG 3660 

IS 

TCAGAATTCA ATCGAAAAAA GCGTAGCAAA AATATTTTGG ATTTTTCTGA TTATGAACAT 3720 

TTTGCATTAC AAATTTTAAC TAATGAGGAT GGTTOGCCTT CAGAAATTGC CGAATCATAC 3780 

CGTCAACACT TCCAAGAAAT ATTGGTCGAT GAGTATCAAG ATACGAACCG AGTTCAAGAG 3 840 

20 

AAAATACTAT CTTGCATCAA AACGGGTGAT GAACATAATG GTAATTTATT TATGGTTGGA 3900 

GATGTTAAGC AATCCATTTA TAAATTTAGA CAAGCTGATC CAAGTTTATT TATTGAAAAG 3960 

2S TATCAACGCT TTACTATAGA TGGAGATGGC ACTGGACGTC GAATTGATTT GTCGCAAAAC 4020 

TTCCGTTCTC GAAAAGAAGT ACTGTCAACG ACTAACTATA TATTCAAACA TATGATGGAT 4080 

GAACAAGTCG GTGAAGTAAA ATATGATGAA GCGGCACAGT TGTATTATGG TGCACCATAT 4140 

30 GATGAATCGG ACCATCCaGT AAACTTAAAA GTCCTTGTTG AAGCGGATCA AGAACATAGT 4200 

GATTTAACTG GTAGTGAACA AGAAGCGCAT TTTATAGTAG AACAAGTTAA AGATATCTTA 4260 

GAACATCAAA AAGTTTATGA TATGAAAACA GGAAGCT AT A GAAGTGCGAC ATACAAGGAT 4320 

35 ATCGTTATTC TAGAACGCAG CTTTGGACAA GCTCGCAATT TACAACAAGC. CTTTAAAAAT 4380 

GAAOVTATTC CATTCCATGT GAATAGTCGT GAAGGTTACT TTGAACAAAC AGAAGTCCGC 4440 

TTAGTATTAT CATTTTTAAG AGCGATAGAT AATCCATTAC AAGATATTTA TTTAGTTGGG 4500 

40 

TTAATGOGCT C CGTT AT AT A TCAGTTCAAA GAAGACGAAT TAGCTCAAAT TAGAATATTG 4560 

AGTCCAAATG ATGACTACTT CTATCAATCG ATTG 4594 
(2) INFORMATION FOR SEQ ID NO: 201: 

45 

(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 6313 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
53 (D) TOPOLOGY: linear 
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GGTTTTCnTG GAAAGATAGT GAAAATCTCG TGTTTTTTGG TTTTgAGGTG TTGTTTGTAT 60 

TTTaTAAAAT GGCTTACATA TATGAAGCGT TGATTAAGTA TGGAATTGTT AATTAATTGA 120 

5 ACCTATTTAG CTTTAAGAAG GCATAACAAG ATGACCTTAT TTTATGCTAT AATATTTCTA 180 

TTATGCGAAG ATTAAGGTGA GTAGTAAATT GGATAAAAAA GTAAGTATTC AAACAAAGCA 240 

AGTGTTGAAA CAGCACAACG AAAAAGAAAA ATTTGAATTT ACTACTGAAG GAACTTGGCA 300 

10 

ACAAAGGCAA TCTAACTTTA TTCGGTATGT AGAACAAATT GAGGATGCAA CAGTTAATGT 360 

TACAATAAAA GTGGATGATG ATAGCGTTAA GTTGATTCGT AAAGGCGACA TTAATATGAA 420 

TTTGCATTTT GTTGAAGGAC AAACGACAAC AACTTTTTAC GATATATCGG CTGGACGAAT 4 80 

IS 

TCCACTAGAA GTTAAAACAT TACGCATTTT ACATTTCGTA AGTGGAGACG GTGGCAAGCT S40 

AAAGATTCAT TATGAATTAT ATCAAGATAA TGAAAAAATG GGTTCTTATC AATATGAAAT 600 

2Q TAACTATAAG GAGATAGGCG AATGAATATT ATTGATCAAG TGAAACAAAC ATTAGTAGAA 660 

GAAATTGCAG CAAGTATTAA CAAAGCAGGA TTAGCAGATG AGATTCCTGA TATTAAAATT 720 

GAAGTTCCTA AAGATACAAA AAATGGAGAT TATGCTACTA ATATTGCGAT GGTACTGACT 780 

25 AAGATTGCAA AGCGTAATCC TCGTGAAATT GCTCAAGCGA TTGTTGATAA CTTAGATACT 840 

GAAAAAGCAC ATGTAAAACA AATTGACATT GCTGGTCCAG G ATT CATTAA TTTTTACTTA 900 

GATAATCAGT ATTTAACAGC AATTATTCCT GAAGCAATTG AAAAAGGTGA TCAATTTGGA 960 

30 CATGTAAATG AATCAAAAGG TCAAAATGTA TTGCTTGAGT ATGTTTCAGC TAACCCTACA 1020 

GGAGATTTAC ATATTGGTCA TGCTAGAAAT GCAGCAGTTG GTGATGCTTT AgcTAAtATT 1080 

TTAACTGCAG CTGGCTATAA TGTAACACGT GAATATTATA TTAATGATGC TGGTAATCAA 1140 

35 ATTACTAACT TAGCGCGTTC GATTGAAACA CGTTTCTTTG AAGCTTTAGG TGACAATAGT 1200 

TATTCAATGC CAGAAGATGG CTATAATGGA AAAGATATTA TTGAAATAGG TAAAGATTTA 1260 

GCAGAGAAAC AC CCTGAAAT TAAAGATTAT TCTGAAGAAG CACGTTTGAA AGAATTTAGA 1320 

40 

AAATTAGGCG TAGAATACGA AATGGCTAAA TTGAAAAATG ATTTAGCAGA GTTCAATACG 1380 

CATTTTGATA ATTGGTTTAG TGAAaCATCT TTATATGAAA AAGGAGAAAT TCTTGAAGTT 1440 

TTAGCAAAAA TGAAAGAATT AGGTTATACG TATGAAGCTG ATGGCGCTAC ATGGTTACGT 1500 

45 

ACAACTGATT TTAAAGACGA CAAAGACAGA GTATTAATTA AAAATGACGG TACATATACG 1560 

TATTTCTTAC CAGATATTGC GTACCACTTC GATAAAGTAA AACGTGGTAA TGACATTTTA 1620 

SO ATCGATTTAT TTGGTGCTGA TCATCATGGT TATATTAATC GTTTGAAAGC ATCTCTTGAA 16 80 

ACGTTTGGTG TAGATAGTAA TCGTTTAGAA ATTCAAATCA TGCAAATGGT TCGTTTAATG 1740 

55 



914 



EP0 786 519 A2 



ATTATOGACG AaGTTGGCGT TGACGCTGCA 
AGTCACTTTG ATTTTGATAT GGAATTAGCG 
5 TATGCTCAAT ATGCACATGC GCGTATTTGT 

ATTGAAGTGA CTGCTGCGAA TGATTTTACA 
TTGAAAAAAG TAGCTGATTT CGAACCTACA 

10 

CATAGAATTA CTAATTATAT TCAAGATTTA 
GAAAAAGTGT TAACAGATGA TATTGAAAAA 
GTCAGAATTA CATTGAAAAA TGCATTGGCA 

75 

TAAGAACATT TATATACACT CCAACGTAGA 
TTTTTTTTAG GTATGTGACA TATTGGGGAA 

20 CACAGTTGGA TGCTCTGCAC AACTGCATAA 

GCTCTACAAA GTTATAATGG CAGTAGTTGA 
TTTCAATTCT AGTCAACCTT GCCGGCGGGG 

26 TCTACAGACA ATGCAAGTTG GGGTGGGACG 

TGTCCCACTC CCTCTAAAAT GGAGGGTGTA 
TTTATATGAA CATCTCGGAC CACAATTTTG 

30 GTTAGGTGCA ATTTTAGTTC AAAATACTAG 

GATTAAAGAA CATACGCATT TTAATCCAAA 
ACAATCATTG ATACATTCAA GTGGCTTTTA 

35 ATTAACATGG TTAGCACGAC ATCATTTCAA 

TGGATTAAGA AAAGAATTAT TATCTTTGAA 
ACTTGTTTAT ATATTCGGAC GTATTGAATT 

40 

TGATAAATTA GGATATGAAA ACACTAAAAA 
ACCAAATCAT TTTACAAATC AAGATGCTAA 
TAAACATTAC TTTAGAGACA AAGATATAAA 

45 

AAAGTAAACG CTGTGAAGTT AGATAGATGA 
ATTTTCTTTT AGTATGTGGA CTTATATAAT 
SO GTTTGTTTGT GCAGCAACTG CATAAGAGCC 

GAATACAGTT GTTTGTGCAG CAACTGCATA 



CGTTATTTCT TAACTATGCG TAgTCCTGAT IB 60 

AAAGAGCAAT CTCAAGACAA TCCAGTTTAC 1920 

TCAATTTTAA AACAAGCGAA AGAGCAAGGT 1980 

ACGATTACTA ATGAAAAAGC GATTGAATTG 2040 

ATTGAAAGTG CTGCTGAGCA TAGATCGGCA 2100 

GCTTCTCATT TCCATAAATT CTATAATGCT 2160 

ACAAAAGCAC ATGTTGCTAT GATTGAAGCG 2220 

ATGGTCGGTG TAAGOGCACC TGAATCAATG 2280 

GTTTCTCGAA AGATACTTTG TGTTGGAGTG 2340 

TGCTTAGTAT GTGAATAAGG TTAAGAGGAA 2400 

GAGAGCCTGA GACATAAATC AATGTTCTAT 2460 

CTGAACGAAA ATTCGCTTGT AACAAGCTTT 2520 

CCCCAACAAA GAGAAATTGG ATTCCCAATT 2S80 

ACGAAATAAA TTTTACGATA ATATCATTTC 2640 

AATGTTAGGA ACTGATGAAT TATATAAAGT 2700 

GTGGCCTGCT GATAATGACA TTGAAATGAT 2760 

ATGGCGAAAT GCAGAAATTG CATTGAATCA 2820 

TCATATATTA GAACTACCTA TTGAAACGTT 2880 

TAAAAGTAAA TCACTGACGA TTAAAACATT 2940 

TTATCAAGAG ATTAATGAGC GATATAAAGG 3000 

AGGTATTGGA AGTGAAACAG CAGATGTCTT 3060 

TATTCCAGAT AGCTATACAA GAAAAATATA 3120 

TTATGATCAA TTAAAAAAAG TAGTCaCATT 31 80 

TGAATTTCAT GCTCTGTTAG ATGTATTTGG 3240 

GAATTATGAT TTTTTAGAAC CTTACTTTAA 3300 

GTTTATATGA AATATAAAAA ATAATTTACT 3360 

AAATAGAAGC ATATAAAGAA AAAAACAGTT 3420 

CCTAATCGCT AAAGCTCAAG GGGAGTAAAG 3480 

AAAGCCTCTA ATCACTAAAG GTGAAGAGGA 3540 
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10 



1S 



20 



25 



AACGCAGTTG GATgCTACCG CACAACTGCA TAAATCCCTC TaATCgcTAA AGCGAAAAGT 3660 

GGGATTAAAA AGOAGATGTG ATAGTGTGAA GAAATCGTTA ATTGCTTTTA TTTTGATTTT 3720 

TATGCTTGTC CTGAGTGGCT GTGGTATGAA AGATAATGAT AAACAAGGTA GCAATGATAA 3780 

TGGCTCGTCT AAATCGCCGT ACCATAGAAT TGTTTCGTTA ATGCCTAGTA ATACTGAAAT 3840 

TTTATATGAA TTAGGATTAG GTAAATACAT AGTTGGTGTT TCAACGGTTG ATGATTATCC 3900 

AAAAGATGTG AAAAAGGGTA AGAAACAATT TGATGCTTTG AATCTAAATA AAGAGGAACT 3 960 

TTTAAAGGCA AAGCCAGATC TAATTCTTGC GCATGAGTCG CAAAAGGCAA CTGCTAATAA 4020 

AGTATTGTCA TCATTAGAGA AACAAGGCAT CAAAGTAGTG TATGTTAAAG ATGCACAATC 4080 

AATTGATGAA ACTTACAACA CATTTAAGCA AATTGGGAAA TTAACGCATC ATGATAAGCA 4140 

GGCTGAACAA CTTGTTGAGG AAACTAAAGA TAATATCGAT AAAGTCATAG ATTCAATTCC 4200 

TGCTCATCAT AAAAAATCAA AAGTATTTAT TGAGGTTTCA TCAAAGCCTG AAATATATAC 4260 

AGCAGGGAAG CATACATTTT TTAATGATAT GTTAGAAAAA TTAGAAGCCC AAAATGTGTA 4320 

TAGTGACATT AATGGTTGGA AC CCTGTAAC GAAGGAAAGT ATTATTAAAA AGAACCCAGA 43 80 

TATATTAATT TCGACGGAAG CTAAGACAAG ATCAGATTAT ATGGATATCA TCAAAAAAAG 4440 

AGGTGGATTC AATAAAATTA ATGCTGTCAA GAATACACGT ATTGAAGTTG TAAATGGTGA 4 500 

TGAAGTATCA AGACCAGGTC CACGTATTGA TGAAGGATTA AAAGAATTAA GAGATGCAAT 4 560 

30 TTATAGAAAA TAAACCATTC TAATTATGCC CCTTATTGCT ACATGTAAAA AATACATGTT 4 620 

TGAGATAAGG GGTTTTTaAA ATATATTTAG TGAATGATAG CAACGCGAGT ATGTGATTGC 4 680 

TATAATGAAT GTAATTATCG ATGAAcaaAA GAGAATGCTA TGACATTTAA TAAAGTATTA 4 740 

TTGAGCTG^a TAGTCmTATT GATTATAACA ACTAGCATAT ATCTATTTTG GCAGTTGGGC 4 800 

GATATCAATG ATGTATTTAA CCAGTCTATT TTAATCAATG TTAGATTACC GAGATTATTA 4 8 60 

GAAGCATTGT TGACAGGTAT GATATTAACT GTTGCAGGCC TTATATTTCA AACAGTTTTA 4 920 

AATAATGCAT TGGCAGATAG CTTTACATTA GGATTGGCAA GCGGCGCTAC ATTTGGTTCA 4 980 

GGATTAGCAT TATTTTTAGG TTTAACAACG TTATGGATTC CTGTATTTTC AATAACATTT 5040 

AGTTTGATAA CATTAATAAC TGTATTAGTC ATTACGTCGG TATTGAGCCA AGGCTATCCA 5100 

GTTAGAATCT TAATATTAAG TGGTTTAATG ATTGGTGCGT TATTCAATTC ACTTCTATAT 5160 

TTTTTGATTT TATTAAAACC TCGCAAATTA AATACAATTG CCAATTATCT GTTTGGTGGT 5220 

TTTGGTGATG CAGAATACTC AAATGTATCT ATAATAGCAA TCACATTTAT CATTGCATTG 5280 

TTTGGTATAT TTATCATTCT TAATCAACTA AAGTTATTGC AATTAGGAGA ACTAAAAAGT 5340 
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ATAAOGGCGA TAAATGTCGC ATATGTTGGC ATCATTGGAT TCATTGGTAT GGTGATACCG 5460 

CAACTCATTA GAAAATGGCA GTGGAAACAA TCATTAGGAA GACAATTGGC TTTAAATATT 5520 

5 GTAACTGGAG GACAAATAAT GGTTATGGCA GATTTTATTO GTAGCCATAT ATTGT CACCA 5580 

GTACAAATAC CGGCAAGTAT TATCATTGCA TTAATTGGTA TACCAGTGTT AtTTTACaTG 5640 

CkAAwAtCtC aGTCgAAAcG GTTACaCTAG CACACGACaT TTGCTAAAAT AAAAATAACT 5700 

10 ATAAACATAA AGAGGGCATA AGCGATGGAT TTGAATCAAA TTAAAGCAGT TGTATTTGAT 5760 

TTAGAAGGTA CGTTGTTGGA CAGAGTTAAA TCTCGAGAGA AATTTATCGA AGAGCAATAT 5820 

GAACGATTTC ATGACTACTT AATTCATGTT CAACTGGCAG ATTTTAAAAA AgCATTTATT 5880 

GAGCTAGATG ACGATGAAGA TAATGATAAA CCTGATTTAT ATAAAGAAAT CATTAAACGT 5940 

TTCCATGTAG ATAGGTTAAC TTGGAAAGAC TTATTTAATG ATTTTGAAAT GCATTTTTAT 6000 

CGTTATGTAT TTCCTTATTA CGATACTTTG TATACACTAG AAAAgCTATC GCAAAAAGGC 6060 

20 

TTTCAAATTG GTGTTATCGC AAATGGTAAA TCTAAGATTA AACAATTTCG ATTACATTCA 6120 

CTTGGTTTGA TGCATGTTAT TAATTATTTA TCAACATCAG AAACAGTTGG TTTTCGTAAA 6180 

2S CCACATCCTA AAATTTTTGA AGATATGATT GATCAACTAG GGGTATTACC TGAGCAAATT 6240 

ATGTATGTTG GCGATGATGC GTTAAATGAT GTAGCTCCAG CACGAGCTAT GGGCATGGTT 6300 

AGTGTATGGT ATA 63i3 

30 (2) INFORMATION FOR SEQ ID NO: 202: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2174 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
35 (D) TOPOLOGY: linear 

" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 202: 

40 



45 



SO 



CCGTAAACAC 


ATCAACAAAA 


GAAGGCTATA 


TTACAAAAGA 


AGACTTGGAC 


TTATGCTGCA 


60 


CGTCGCTCTA 


ATTCAGCTGG 


AATGCAAGTC 


ACCGGACGAC 


TGGCTTACAT 


TGAACCTTAT 


120 


GGGGCAACAA 


GTCGCACAAA 


ATAAACGCGC 


GAGAAGCaAG 


AATAGGAAGT 


GATATCTATG 


180 


AAATGGTTAT 


CACGAATATT 


AACAGTAATA 


GTGACCATGT 


CtATGGcGTG 


TGGTGCATTG 


240 


ATATTTAATC 


GTAGACATCA 


GCTAAAGGCG 


AAAACGCTGA 


ACTTCAATCA 


TAAAGCATTA 


300 


ACAATTATTA 


TTCCGGCTAG 


AAACGAAGAA 


AAAAGAATAG 


GTCATTTACT 


ACATTCGATA 


360 


ATACAACAGC 


AAGTTCCAGT 


AGATGTCATT 


GTTATGAATG 


ACGGATCGAC 


AGATGAAACA 


420 
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10 



15 



20 



AAATGGTATG GGAAATCACA TGCTTGTTAT CAAGGTGTOA CGCATGCATG TACGAATCGC 540 

ATTGCCTTTO TAGATGCTGA TGTAACTTTC TTAAGGAAAG ATGCTGTTGA AACGTTGATT 600 

AATCAGTATC AATTACAAGG TGAAAAAGGA TTGTTAAGCG TACAGCCTTA TCATATAACA .660 

AAGCGTTTCT ACOAAGGGTT TTCAGCGATA TTTAATTTAA TGACAGTCGT TGGTATGAAT 720 

GTATTTTCTA CCTTAGACGA CGGTCGGACT AACCAGCATG CATTTGGACC GGTGACATTA 780 

ACAAATAAAG AAGATTATTA TGCAACTGGA GGTCATAAAA GTGCAAACCG TCATATTATT 840 

GAAGGATTTG CTTTAGGAAG TGCATATACT TCACAATCAT TGCCCGTAAC AGTTTATGAA 900 

GGGTTTCCAT TTGTTGCATT TCG CATGTAT CAAGAAGGAT TTCAGTCATT ACAAGAAGGA 960 

TGGACAAAGC ATTTGTCAAC TGGGGCAGOT GGCACAAAGC CTAAGATGAT GACAGCAATT 1020 

GTGTTGTGGT TGTTTGGTTC TATAGCGAGT ATTTTAGGGC TATGTCTTAG TTTAAAATAT 1080 

CGCCAAATGT CTGTAAGAAA AATGGTAGCA CTTTACTTGA GCTATACTAC ACAATTTATT 1140 

TATCTGCATC GAAGGGTCGG CCAATTTTCT AATTTATTAA TGGTATGTCA TC CATTGTT A 1200 

TTTATGTTTT TTACTAAAAT TTTCATCCAA TCTTGGAAAC AAACGCATCG TTATGGTGTA 1260 

25 GTTGAATGGA AAGGTCGTCA ATATTCTATA TCTAAAGAAC AATAAATCAA GGTAATGGCA 1320 

TTTCAATATA GGAGGACTAG TATGACAATG ATGGATATGA ATTTTAAATA TTGTCATAAA 13 8 0 

ATCATGAAGA AACATTCAAA AAGCTTTTCT TACGCTTTTG ACTTGTTACC AGAAGATCAA 144 0 

30 AGAAAAGCGG TTTGGGCAAT TTATGCTGTG TGTCGTAAAA TTGATGACAG TATAGATGTT 1S00 

TATGGCGATA TTCAATTTTT AAATCAAATA AAAGAAGATA TACAATCTAT TGAAAAATAC 1560 

CCATATGAAC ATCATCACTT TCAAAGTGAT CGTAGAATCA TGATGGCGCT TCAgCATGTT 162 0 

GCACAACATA AAAATATCGC CTTTCAATCT TTTTATAATC TCATTGATAC TGTATATAAA 1680 

GATCAACATT TTACAATGTT TGAAACGGAC GCTGAATTAT TCGGATATTG TTATGGTGTT 174 0 

GCTGGTACAg TAGGTGAAGT ATTGACGCCG ATTTTAAGTG ATCATGAAAC ACATCAGACA 1800 

TACGATGTCG CAAGAAGACT TGGTGAATCG TTGCAATTGA TTAATATATT AAGAGATGTC 1860 

GGTGAAGATT TTGACAATGA ACGGATATAT TTTAGTAAGC AACGATTAAA GCAATATGAA 1920 

GTTGATATTG CTGAAGTGTA CCAAAATGGT GTTAATAATC ATTATATTGA CTTATGGGAA 1980 

TATTATGCAG CTATCGCAGA AAAAGATTTT CAAGATGTTA TGGATCAAAT CAAAGTATTT 2040 

AGTATTGAAG CACAACCAAT CATAGAATTA GCAGCACGTA TATATATTGA AATACTGGAC 2100 

GAaGTGAGaC AGGCTAACTA TACATTACAT GAACGTGTTT TTGTGGaTAA GAGGAAAAAG 2160 

GCAAAGTTGT TTCA 2174 
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<i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4715 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 



IS 



20 



25 



30 



3S 



AS 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 203: 

GAAnCAGnTA GACAAATTAT GGaAAmCGGT GTGAATCaAG GATTCtTTGG TGTAGCTGGT 60 

TTTGACCTAC TCGTCGATGA GGATGATAAC GTTTATG CGA TTGATTTAAA CTTTAGACAA 120 

AATGGTTCaA CGAGCATGTT ATTACTTGCT AACGAGTTGA ATTCAGGATA TCAAAAGTTT 180 

TATAGTTATC ATTCAAAAGG TGATAACACA C A TTTCTTCA ATACGATTTT GAAATATGTC 240 

AAAGAAGGTA GTTTATACCC GTTATCTTAT TATGATGGTG ATTGGTACGG TGAAGATAAA 300 

GTTAAATCAA GGTTTGGCTG TATTTGGCAT GGTGATTCAA AAGAAACAGT ACTGGAGAAT 360 

GAACGCGCAT TTTTAGCTGA ACTTGAACAC TATTAGAGTT CGGAACATAA GGCGCTACAA 420 

TGTTGTGTTG CCAGTAGTTG ACTGAATATG CGTTTGTAAC AAGCTTTTTT CGATTCTAGT 480 

CAACAGTAAT TAAATTTATG ATATGGCAAT ACTTTGTAAT ACTAATATTA AATGGCGACT 540 

TTTATTTCAC TATGTTATAA GAGTTGCCAT TTTGTTGATA AAGGTATACT AAAGGTTATC 600 

GTTTTGAAAT TTTTAGTAAC TAGATATGTT TCGTGTTATA. GACCGAATTT GTGTATACGT 660 

AAAATTTAAT GCTATTGAAT TTTTAAAATG AAAAACATGA CATTAAATTG AATTCATAAT 720 

ATGTCTAATT GACTAACTTG TTGGAGTCAT TTACTATTTT ATGTATGACA TATTTTAAAA 7B0 

AGTGAGGGTC AAGCATOTCT TATAAAGCAT ATCCATTCTT TAGAGATATA TTAATAAATG 840 

AATGTATTTA TTTCGCCTCT AAAAATAAAA AACTAGTACG CCTAAATTAT AAAAGTGAAG 900 

CGnATGTAGG CGTTTGGACA GAAGAAAGTG TGGCCGTATC ATTTTTAACA AGTCGTGATA 960 

TTCCATTTGA TAAAGTTGTA AAAATGGACG TTGATCGTTT TGCTACTTAT GAATTAGATG 1020 

AATTGTTTGA TGAACAAGAC CATATTATTA TGAATCAAAC AATGGAAGAw GAAGGGCATC 1080 

TACTAAACGT TGTAGCTGTT ACACAAGAAG TGATGACGGA ATTAGATAAA ATTAGAATCA 1140 

AAGAATTTGT CCAAGATGTA GCGAAATATG ATGAAGTATA CGGCTTAACT AAAAAAGGTA 1200 

GTAAGCAGTT TATTCTCATT AGTGAAAATG ATAGCGACGA AAAAAAGCCG CATATTATGC 1260 

CTGTATGGAG TATTAAAAAC AGAGCGTTAA AAGTTCGAGA TGAAGATTTT GAAGAGTGTG 1320 

ATTTAATTAC GATTGAAGGT TCTGTTTTCG GAGAATGGCT AGATGAACTT AGAGATGATC 1380 

ATAAAGCCGT TGCGATAGAT TTAAAAACTG GCGTGGTTGG TACAATTGTT TCAGCGCAAA 1440 
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ATGGAACAAT ACGTATTCAA AACACTTAGA 
TTATTTAAAA CAACGCGCAT ATAAATGGTC 
5 ATAGCACCTG nAAAATGCGC CGTTTTCAAC 

ATAATCTTCC ACAACTTTGC GTAATAAAGC 
GATATTTTCA GTTTTAAATT CACGTG CAAC 

10 

AACGACACCA ATAACGGCTG CTAATTTATT 
TAGTACATGA CCAAAATTAG CTGCTGTTAA 
ATAAATATGT CTAACCTTTA AATCGATAGT 

1S 

TAACTGTTTA TAATCAGTGA TTTGACTTAG 
ACCTGTACCG ATACCGCCTA CACGACGTTG 

2Q ACCGGTACCA ACATTTGCAA AAATATAATC 

AATACCTAGT CCTTGAGATG CAGCATCAAA 
GTTTTCAGCA ATGACACCTG CATTACCTCC 

25 GTTTAACCAT TCCACAACTT GATCAATATT 

GTTATCTTGC TCTTGAACGA TTTTAATTAG 
AAGATTCCCA CCTCATTATT AATGTCTATC 

30 AAACAAGTAA TAATAGTAAT TATTAACAAA 

cGTATCGCAA TTAAtGTTTT ACAAAGGTGG 
ATTTTGAAGT TGTATAGGAT TGTTAGTTAG 

35 

GTGTATTTGT AAGTCTCTGA TTAAAATGAT 
AATTTAAAAA ATATAAATAA GTAATTTATT 
AAATAATAGG TAAAATAATA TGGGGATTCA 

40 

TATATGGCTA AAGAACTTTG TTTTGAAGGT 
CGTTCAGCAA TTAATGATTT TGACTTGAAT 
AAAGAAGTTA TTGATGATGC AATTAATGAT 

4t> 

GATAAAAATG AAGTGGTGGG CTTTTTTGTA 
GATACACCTG AAAATGTCGT TTATATTCGT 
50 TTTGGATATG GCACGAAAAT AATGATGTCA 

GATTTTAATC ATCTATATCT AGTAGTAGAT 



CCATAAAATA AAAGGCCATT TATATAGCGT 1560 

TTTTTCTATT TTTCTAAATA TAATGCACCA 1620 

ATAGTACGGT TTGCAACCGC GTAACACAGT 1680 

GTTATTATGA AATOAAGAAC CGATATAAAC 1740 

AGTAATGGCC ATTGTCGTAA CAACTTOGCC 1800 

GCTAGGTGTA AAATCAGCAT CTAAATGATG 1860 

ATCACCGGGA ATGGGTGGTT CGGTATCTTT 1920 

GTTACGATCA CCGTGTTGTG CCATGTCAGT 1980 

TAAATAACCG AGTCCTTGAA TCATGCCTCC 2040 

TGATTGGCCG TOGAAATAAT GTAGTGACGT 2100 

TGCTAAGTCA TGGCCTTGCT CTTTTAACAA 2160 

CTCTACAAAA ATTTGTGCAG GAATGTTGAT 2220 

AGTTAAGCAT AATTTTTCAA TTTCCTGTTG 2280 

TTTAGTTAAT TCAGTTTTAA AAGTACGTTG 234 0 

TGTACCGCCA GCGTCAATGC CAACTTTCAT 2400 

CTTAAATAAT AGTATAGTAA AATGACTAAA 2460 

TTTGATGCCa TTGCATTTCA ACATTGTAAG 2520 

ACGTTAAGTt ATATATATTA TTTTCTAGGA 2 5 BO 

TGACGCAATA TTAAAAGTAG TTCGTACGCA 2640 

AAGTAATGAG GAATAGTACA TTAATTTTGA 2700 

TAACTTAGAG CAAATAATGG TATCGTAGTG 2760 

TGCTTCATAT ATAAAAAGAT AGGGGTTAAA 2820 

ATCACTTTAA AAGCATTTGA TGAACAATAT 2880 

GAAAGACAAC AAATATATTC ATCTTTACCT 2940 

GCTGATAGGA TTGCTAACGT AGCAwTAAmC 3000 

TTACATCGTT ACTATCAGCA TGAAGGTTAT 3060 

TCATTATCGA TTAATGAAAA ATATCAAGGT 3120 

TTGCCGCAAT ATGTTCAAGG TGTATTTCCT 3180 

GCGGAAAATG ACAATGCTTG GAACCTATAC 3240 
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CTATATTACT TGGACTTAGA TTCAAAACAT GTTTCATCAT TAAAGCTTGA AGAAGAAAGT 3360 

CGTTCAGAAG TGACCAATGT ACATATCATT AATTTAATGA TTGATGGCCA AAAGGTTGGC 3420 

5 

TTTATCGCAT TGGAGCAGAT TGGTGAACGC ATGAACATTG CTGCTATTGA AGTGGATAAA 3480 

TCATATCGCT TTAATGGTAT TGGTTCAAGT GCTCTGCGAC AATTGCCAAC TTACTTAAGA 3540 

AAAAACTATG ACAACCTTAA TGTGATTACG ATGATTCTGT TTGGAGAGAA TAATGATTTT 3600 

10 

AAACCATTAT GTTTAAATAG TAATTTCGTT GAAATCGAAC AAACTGATGA TTATGTCGTT 3660 

TTCGAAAAAT ATTTAAATTA CTAACAGTGA TTGCGAAATA TGATATTGTC ATTTATAATT 3720 

r5 TAGTTTTGTT ACTATATATA AATGAATTCA GACGTATAAA TTTAGATTAT ATCCTTCGAA 3780 

AGGAAGTATT GGGCAATGAA AATTCAAGAT TATACAAAAC AAATGGTTGA TGAAAAATCA 3840 

TTTATTGATA TGGCTTATAC ATTATTGAAT GATAAAGGCG AAACAATGAm tnTTATATGAT 3900 

20 ATyATCGATG AATTTAGAGC GTTAGGTGAT TATGAGTACG AAGAAATTGA AAATCGTGTT 3 960 

GTACAATTTT ACACGGATTT AAACACAGAT GGTCGTTTTT TAAATGTTGG AGAAAATTTA 4020 

TGGGGATTAC GTGATTGGTA TTCGGTAGAT GATATTGAAG AGAAAATCGC ACCAACTATT 4080 

25 CAAAAATTCG ATATTCTGGA TGCAGATGAT GAAGAAGATC AAAACTTAAA ATTATTGGGC 4140 

GAAGATGAAA TGGATGACGA CGATGATATT CCAGCTCAAA CAGATGATCA AGAAGAACTA 4200 

AATGATCCAG AAGATGAGCA GGTTGAAGAA GAAATCAATC ATTCGGATAT AGTCATTGAA 4260 

30 GAAGATGAAG ATGAACTAGA CGAAGACGAA GAAGTGTTTG AAGACGAAGA AGACTTCAAC 4320 

GATTAATTTT TTGTTTGACT TTTAGTTGAA AGATGATAAA ATTTTATTCG GGCTCCTTTA 4 380 

AATAGGACAC GTGTATAAAA TTTATACGCT CCCCTTACAG AATTTGTGAG AGGGAGCGTT 444 0 

35 

TTTTtATTTA ATTGAGTAAA TCAAGAAATG ATAACGCAAA AATCAAAGTT GTAAATGATA 4500 

TACAJAGTGA CATAGCAGTA TGGAAACGGT AAGTAAACAG AATTTAATTT TGTCGAtTCG 4560 

ACAAtAAaCA a CT tGAaTGA GCTTGCTTTA ATGTTATGTn nTACGTAATT TTTACAATTG 4620 

40 

ATGAGGAAGC ATTCCCTTTA ATAATTAGGA GGTCAAGACA TGACAAAATT TATTTTTGTA 4680 

ACAGGTGGCG TAGTTTCATC CATTAGGGGA AGGGT 4715 
4$ (2) INFORMATION FOR SEQ ID NO: 204: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 918 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
50 (d) TOPOLOGY: linear 
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ATAATAACTG AAATTAAAAT TGCTAAATmG TGTTaAgCTA TCGCmACAAT OAAAATwCCG 60 

ATTTTGCGTT GTTGAAAATA TCTTTCCAAA CCAAGAATCG ATAATGGCAA TAAATATAAT 120 

AAATTTCCAT AAAATGACCA AGTAAAATTA AAGTATATAA CGACAGTTGA CATGCCGTAT 180 

AAAATCGTAG CGATCATATT TGCTGAGCGT TTAAAGTGTA ATATTTTAAA TAAGTAGAAG 240 

GTCACGACAA ATGTTATGAT AGCTCGTATC ATAGCCATAA TAAGTTGGTT TGTCGGCCAA 300 

AAATGTATTG TCGTCGGATT AAATATACCA ACCGTTTCTC CTATTTTAAT GAAkAGAAAA 360 

TTTAGCCACA TTAAAGGTGA CAGCGAATAA TAATnTGATA GTCCTTTCAT ATAATCGCCA 420 

CCTAtnTCCAA ACGATGCATC ATrTAAACTA GAAnAACTAC GTAGATGTTC ATACAnATAC 4 80 

ATTTGAAATG GCATCATTTG ACGGAATCCA TCTCCAGCCC CGCTAAAAAC AGTACCATTC 540 

ACAATATAAT CATAGATATG AGTAGAAAAT AAAATAAGCG TTAATATTAC ACTAATGAAA 600 

20 GTTATAACAA AGAATTGTTT GACGTTTGAA TTTAGCCACT TTTTTAACAC AACATTATCC 660 

TCAACTTTCA AATTTAAAAT TAAGTTTAAC TGAAACTAAA GTTAATGAGG TTCTTGATAG 720 

GTAAAGACGA AGATGACTGT GGAACAGATA CCTTATCATA GTTACTTAAA CTTTGGATCA 780 

25 TTTTCAGTTT ATCATTAAAC AAATATATTQ AATAATAAAa aTGTCATACT GATAAAGATG 840 

AATGTCACTT AATAAGTAAC TTAGaTTTAA CAAATGATGA TTTTTAATTG TAGAAAACTT 900 

GAAATAATCA CkTATACC 918 
30 <2) INFORMATION FOR SEQ ID NO; 205: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 163 97 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 205: 

40 

TCGCCCnATA ATCAATTTAT TTTTCATGTG CCACTCCTAT ACAAGCTnAC AATGCTTCTT 60 

CAGTTAAGGC AATATCTTTT AATTTTGTTT GATATTTTTG TTCAAAGTCA TATTGTAACT 120 

45 GAACAATTTC TGGCAAACCA ATATGCCAAT CCGCCAATTT TTTTTTAyCT TtGAAGAGCT 180 

CTTTTGGTGA TGkTTGcGAC ACTATACTAC CTTCTTTCAT AACGATGACT TCATCTGCAT 240 

AACGCGCGAC TTCATTCATA TCATGTGAAA TTAGGATAAT TGCCTTATTT TCATCTGTTT 300 

60 GTAGTGACTT TAGTAATCTC ATTACTTGTC GTTTACTTTG TGGATCAAGT CCTGCTGTAG 360 

GTTCATCAAC CACGATAATA TCAGGATTCA TTGCCAATAT CGATACAATC GCTATTTTAC 420 
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AATCCATCAA CAGACGATGG GCATAGTTTT TGGCTTCATC TAAATTCATT TTAAAGTTTT 540 

TAGGTCCAAA TATCATTTCA CGCTCTACTG TGTCCTCAAA TAATTGAGAT TCGGGAAATT 600 

GAAATACCAT TCCAATTCTT TTTCTTACAG GTCTAATATA TTTATCTTTG GTCTTATGTG 660 

TAATAGTAAT GTCATCAACT GTAACTGTCC CAGTAGTCGG CTTTAACAGC GCATTAATAT 720 

TTTGTATCAA CGTTGATTTA CCACTACCCG TTTGTCCAAC GATGGCGTAA TATTTACCTT 780 

GTTCAAATTC TGTATTAACA TCATGAATAG CTTGATGCTG ATATGGTGTC CCTTTTTGAT 840 

AGGTATAACT TACATTGTCA AACCGTATAG TCATAGTTGA TCCACCAGCC CTTCATAAGT 900 

TAAGAATGAT GTTTGGTGTC CCAGCATTTG ATTTATTTTG ATTGGGAATG GCAAATCTAG 960 

ACCTATTCTT GTTAACTCTT CTGCATTGTC GAAAATTTCA GTCGCTGTGC CTTCTTTATA 1020 

GACAGTCCCT TTATTCATAA CGATAACATG ATCTGCTTCC ATCGCCTCAG ATAAATCATG 1080 

20 CGTAATAGAA ATGATTGTAA TATTATGTTC TGATTTAACT TTTCTCACTA AATCCAATAA 1140 

ATTTTGACGT GCATCAGGAT CTAACAT AG A AGTCGCCTCA TCTAATATAA TGACAGAGGG 1200 

GTTAAGTGCT AATACACTTG CTATAGCCAC ACGCTGCTTC TGTCCCCCCG ATAATGCATT 1260 

25 AGGTTCATAA TCTGCACGTT CTAACATATC AACTTGTTTA AGTGCTTCGC TGACTCTTCT 1320 

ATGCATTTCG TCATATCGAA CCGCATGATT TTCGAGTCCA AATGCCACAT CGTATTTTAC 1380 

AATTGAACCA ACAAATTGAT TATCCGGATT CTGAAATACA ATTCCTATGT CTTTTCTTAA 1440 

30 CTTTTCAAAA TTATCATCAG TTATAG CTTG ATTATTATAA -AAAATTTCTC CAGATTTAAC 1500 

TTTCTCTATG CCAATCATTA ACTTGGcAAT TGTAGATTTT CCAGAACCGT TATGACCAAC 1560 

AATAGATGTC CACTGACCTT TAGGTATATT AAAAGAAACA TCTTTCAATG TGAAGGATGC 1620 

ATCACTTTGA TATTGAAATG AAACATTTTT AAATACAATA ACTGAATTCT TATCCTCCAC 1680 

TTGTCTCTCT CCTTTACGAT TCGTGTATCT ATCATATTTT ACAATATTTA TAAATCGCTG 1740 

TATATGACAT TGACTGGGTT CTCTATATAT TACTAGTATT TTCTGACTCA TTTCTAGTCT 1800 

TTAAAGTGTT GTTTAACAAC TAATGATAAG GACTTTTATT CCTCTCTAAC AATTATGTAT 1860 

AAACGTTAAT AAAATAAATG ATTTACTAAT ATAGGGGTGG TCGCGTTTGA TTCAACGATA 1920 

ATACTTTCAC TTCATTCAGT TCTAGTGAAA TTGATCAAAC TAGCTTCATC ATATTTTTAG 1980 

ATTCGCACTC AAAAAAGTAA ATATAAAGAA ATCGGACTTA AAAACATTTC TGTTCATAAG 2040 

TCCGATATTT TATTCAATAA AAAAGCGCGC ACCCCATCAT AAGTTTGTTG AGTTCACGCT 2100 

so TTAAATCTTT ATTTAGTTGA TGGGGTACTC TGAGCTAGAC AATATTTGTA TGTGGCAAAC 2160 

ATTAtCGTTG CACTCATTTG CTTTATATAA AAGTAGTTAG TGTATTTATA TAAATTCTTA 2220 
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ACGAGTGTAA 


CCACCTTGAC 


GTTCTGTGTA AcGCTCTGCG 


ATTTCACCAA 


ATAATTTTTG 


2340 




AAGTGCAGTT 


TGTGTAGTTT 


CATCTTCGTT 


TAAGATTTCA 


ACATTACGTA 


AAGTTTTAGC 


2400 


5 


TGCATTACGA 


CGAGAAGCTA AATCTCCTTT 


TTTACCTAAA 


GTGATTAATT 


TCTCAACAAC 


2460 




ACTGCGAACT 


TCTTTTGCAC 


GAGCTTCTGT 


AGTTTCAATA 


CGTTCACTAA 


TAATAAGTGA 


2520 


10 


TGTAGCTAAG 


TCACGTAACA 


TAGCTTTACG 


TTGATCAGAA 


GTACGACCTA 


ATTTTCTGTA 


2580 


ACCCATGAGT 


TAACCTCCTT 


TATCAATCTT 


CTTTTCTTAA 


TCCTAATCCT 


AAATCTTCTA 


2640 




ATTTGTATTT 


AACTTCTTCT 


AAAGATTTAC 


GACCTAAATT 


ACGCACTTTC 


ATCATGTCAG 


2700 


15 


CTTCAGATTT 


GTCAGCTAAC 


TCTTGAACAG 


AATTGATTCC 


TGCGCGTTTT 


AAG CAGTTAT 


2760 


ATGAACGTAC 


AGATAAGTCT 


AATTCTTCAA 


TAGACATTTC 


TAATACTTTT 


TCTTTTTGAT 


2820 




CTTCTTCTTT 


TTCAATCATG 


ATTTCAGCGT 


TTTGCGCTTC 


ATCAGTAAGA 


CCAACGAAGA 


2880 


20 


TATTCAAGTG 


TTCAGTCATT 


ATTTTTGCTG 


CTAATGAAAC 


TGATTCTTGT 


GGTGTGATTG 


2940 




AACCATTAGT 


CCAAACATCC 


AATGTTAATT 


TATCAAAATC 


ACTGCTTTGA 


CCTACACGTG 


3000 




TATTTTCAAC 


AGTATAGTTC 


ACACGTTCAA 


CAGGTGAATA 


CAATGAATCA 


ACAGGGATTA 


3060 


25 


CACCAATTGG 


TAAATCACTA 


GTATTATTTT 


GTTCTGCTAA 


TGCGTAACCT 


CTACCCTTGT 


3120 




TAGCAACTAG 


ACGAATTTTT 


AAGTGACCAC 


CTTTAGATAC 


TGTTGCAATT 


TTAAGCTCTG 


3180 




GGTTTAAAAT 


TTCAACATCA 


CTATCATGTG 


TAATGTCGCT 


TGCTGTTACT 


TCGCCTTCAT 


3240 


30 


CACGTACATC 


AATTTCTAAA 


GTTTTATCTT 


CTTCAGAGTA 


AATTTTCAAT 


GCTAATTGTT 


3300 




TAATGTT CAT 


AATAATTGTA 


GAAACATCTT 


CAACTACATT 


GTCTACTGCT 


GAGAATTCAT 


3360 




GTAAAACTCC 


CTCAATTTCA 


ATATACTTAA 


cGGCTGCACC 


TGGTAATGAA 


GATAGTAGGA 


3420 


35 


TACGACGTAA 


GGAGTTTCCT 


AGTGTAGTAC 


CGTAG CCACG 


TTCTAGTGGT 


TCAACAACGA 


3480 




ACTTACCGAA 


TTTAGCATCT 


TCACTAATTT 


CAATTGTCTC 


AATTCTAGGT 


TTTTCGATTT 


3540 




CTATCATTTA 


AATATCCTCC 


TTATATACGT 


CGACTTAATT 


TAAAATGTTT 


GCTCAGTGAC 


3600 


40 


CTGTAACAAT 


ACCATCATAA 


ATTATACACG 


ACGACGTTTT 


GGTGGACGAC 


AACCGTTATG 


3660 




AGGTACTGGA 


GTAACGTCTC 


TGATCGCAGT 


TACTTCTAAA 


CCTGCAGATT 


GTAATGCACG 


3720 


45 


AATAGCTGAT 


TCACGACCTG 


GACCAGGTCC 


TTTAACTGTT 


ACTTCAACTG 


TTTTTAAACC 


3780 


ATGCTCCATA 


GCTGATTTAG 


ATGCAGTTTC 


AGAAGCCATT 


TGTGCTGCAA 


ATGGTGTTGA 


3840 




TTTTTTAGAT 


CCTTTGAATC 


CTAATGCACC 


AGCTGATGAC 


CATGATAAAG 


CATTACCGAA 


3900 


50 


CTCATCAGTG 


ATAGTTACAA 


TAGTGTTGTT 


GAATGTTGAA 


CGGATGTGTG 


CTACACCATT 


3960 




TTCAATATTC 


TTTTTCACTC 


TACGTTTACG 


AGATACTTGT 


TTACGTGCCA 


TTTAAAATTT 


4020 
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CGCGCGTkGT TTTTCGTTTT TTGACCACGA 
ACGGTATGAT GAAATTnCCA TTAAAcGTTT 
5 ACCTTCGACT TTATAACCGT CTACAACTTC 

ATCTTTCACA CGAGTATCAG CTGATACGTT 
CGT AC CGATA CCGTATATAT AAGTTAATGA 

10 

TACTCCTGCA ATACGTGCCA TATTAATTTA 
TGTGTTTTGG ATTTTCACAA ATTACCATTA 

1S TTTCGCAAAT AGGTTTTACT GATGGTCTTA 

AGTGACGATT ATTTATAACG ATAAGTAATT 
TCAACAGTTA CTTTGTCGCC AGGTAGAATA 

20 ACGTGAGCnA AAATCTCATG ACCATTTTCT 

GTATCTAATA CAGTACCTTC TAATTCAATT 
CCTTTTTGCA ATAGTAAGGT AATCGTCAAT 

25 GATTAATTTT ATAAGTTAAA CAAAAATTAC 

ATCTATCTAA TATGATTAAA TCATGCCTCA 
TACAAATGAT CTAAAATATC AATCACATCT 

30 

TCAATATTTT TCAATACACC TTTTTGATCA 
ATATTAACAC TCAAACGATT AGCTACCGTT 
TT ACCAC CAT CGATATCACA AATACCTTCG 

35 

TTGTACCACA TGACTCACAG ATTCGACGAC 
GAAdTCGAT ATTGATGACA GCATCAATGT 

40 ATGCCTCAGC TTGCTCGATT GTTCTTGGGA 

CGTCTTCAGA AATTCTTTCC TTAACGATAC 
CACGGTCCAT ATAAGACTTA GCTTCTTTAC 

45 TGAACATGTC ACCAGTTGAA ATGTGGGGTA 

GAGTTCCTTT ACCTGCGCCA GGTAAACCCA 
AATTATCTAC CACCAAAGCC TTTATATTCT 

SO 

ATTGTTTCAA TCGCTACACC AATAACGATA 
TGTGGTAATC CCATAAACTT AGTTGCTAAT 

SS 



ACTGGTAAAC CACGACGGTG ACGGATACCc 4140 

GATATTTAAG TTAGTTTCAC GACGTAAGTC 4200 

ACGGATGOGA CCTAATTCGT CATCAGTTAA 4260 

AGCTTCTTCA AGAATTTTTT GAGCAGTTGA 4320 

GATAACTACG CG TT TT T CAC GTGGAATATC 4380 

CACCTCTCTT TTATTAACCT TGTCTTTGTT 4440 

CTTTACCTTT ACGTTTAATG ACTTTACATT 4500 

CTTTCATTTT TATACCTCCC TATATTATGG 4560 

CTTCCGCGTG TTAAATCGTA CGGAGACATC 4620 

CGAATGTAAT TCATTCTGAT TTTAC CACTT 4680 

AATTCTACTT TAAACATTGC GTTCGGTAAA 474 0 

ACATCTTGTT TAGCCATTGA TTAACTTCCC 4800 

AGACAACTTT ATTGTTACGA ATCTATCAGT 4860 

GGGAATTAAT TATCGTTAAT TGCCACTCTC 4920 

CTTAAAATAG ACCGCTAAAA GTTGATCTAT 4980 

TTGGTAACGT CG CT AAT AT C TTTTGAACCA 5040 

TAGAAATCTA AAATAGGCTT AGATTGTTTA 5100 

TCAGGATTAT CATCTTCTCG TTGATACAAT 5160 

ACTTCGGAGG ATTAAATACA AGATGATACG 5220 

CTGTAAGACG GTTCATTAAT TCTTCTTCCG 5280 

TTCTGTCAAG CTCAGACATA ATATTATTTA 5340 

AGCCATCTAA TAAAAAGCCT TTTTTTGCAT 5400 

CTACAGTCAC TTCATCAGGA ACTAATTCGC 5460 

CTAATTCAGT TTCTTCTTTT ATAGCTTTTC 5520 

TTGGGAATTT CTTGaCAATT TCACTTGCTT 5580 

TCAAAATGAT ATTCATAAGT GCCCTCCTAA 5640 

TTTTGAGATA CTTGAGCTTC TAAAGATTTC 5700 

AGTAAACTTG TACCACCAAT CTGAATTGAT 5760 

ATCGGTAGAA TTGAAATAAC GGCTAAGAAG 5820 
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CCAGGTCTAA TACCTGGAAC ATAGCTACCT TGTTTCTTAA GGTTATCAGC CATTTTTTCC 5940 

GGATTAACTT GTACAAATGC ATAGAAGTAT GTGAATAGTA TAATTAGTAC AATATATACA 6000 

ACCATACCAA CATTACTTGA AGGATTTGCA GCATTCGCAA TGTTTTGTGC CCATTCTTTA 6060 

TCTGGATAGA ACAACGTTAA TGTTCTAGGC AGTAAGAAGA ACGCCATTGC AAAGATTACA 6120 

GGAATAACAC CGGCTGAGTT CACTTTTAAA GGTAGATAAG TTGCCTGTGA ACCTAATCTT 6180 

TGAGCAGTTT GTTTCTTAGC ATATTGAATC GGAATTTTAC GAACGGCTTC AAGTACATAA 6240 

ATAGCACCTA CAGTTAATAG TATCAGTGAC ACTAAAAOTC CTAATACTTT CAACCATGCT 6300 

AATGATGTAT CTTCTTGCCC AACGAACOCA tTTGTcCAAA TTGAATTAGA CTGGCTGGCA 6360 

ACGTTGATAA AATACCCGCA AATATGATAA TAGAAATACC ATTACCAACA CCGAACTGAG 6420 

TGATTTGATC ACCAAGCCAT ATTAAGAAAG CAGTTCCTGC TGTnCAAAAC TAGTGCTATT 6480 

20 AATAAATAAC TCATAATTGA CTGATTGATA ATCAGCGCAC CTTTGAGATA ATTATTAAAT 6540 

TGGAATGCCA TACCTATAGA TTGGATAAAT GCTAAAGAAA TTGCTAAATA ACGAGTAACG 6600 

TTATTTAACT TTCTTCTACC TACTTCACCT TGTTTTGCCC ATTCTGAGAA TTTAGGGACA 6660 

25 ATATC CATTT GTAATAATTG CATTACGATT GATGCAGTGA TGTAGGGTAC AATACCCATT 6720 

GCAAAAATAG AAAATCGTTT CAAGGCTCCG CCACCAAAAG TATTTAATAA CTCAGTGGCA 6780 

CCTTGAGAAC CTTGGGGATT ATCAAAAGCT GCAGGATTTA CTCCTGGAGC TGGTATATAA 6 840 

30 

GTCCCTATTT TAAAAATTAC TAACATTGCT AGTGTGAAGA AAATCTTGTT ACGAACCTCT 6 900 

TTTGTTCTAA AGAAGTTCAC AAGGGTTTGA ATCATTAGAT CACCTCGTGT GcTCCACCTT 6 960 

TAGCATCAAT AGCTTCTGCT GCTGAAGCTG AGAATTTATG AGCTTTCACT GTCAATTTCT 7020 

35 

TATCAAGTGA ACCATTACCT AGTATTTTGA TACCAGATTT TTCATTCTTA ACAACACCAG 70 80 

ATTCTACTAA TAAAGCTGGA GTTACTTCAG TACCATCTTC AAATTTATTA AGTTGGTCTA 7140 

40 AGTTAACAAT AGCATATTCT TTACGATTTA TGTTAGTAAA ACCACGTTTT GGTAAACGAC 7200 

GGAATAATGG TAATTGACCA CCTTCAAATC CTGGTCTTAC ACCACCGCCT GAACGAGCTT 7260 

TTTGACCTTT GTGTCCGCGA CCACTTGTTT TACCGTTACC TGTCGCAACA CCACGTCCAA 7320 

45 CACGATTGCG TTCTTTACGT GAACCTTCTG CCGGTTTTAA CTCATGTAAT TTCATTTCGG 7380 

CACCTCCTTG ATTATTT TT C TTCTACTGTT ACTAAGTGCT TAACTTTGTT GATTTGCCCA 7440 

CGAATAGCAG GGTTATCTTC AACAACTACT GAACTGTTAG TCTTTTTAAG ACCTAAAGCT 7500 

60 

TCAACAGTTT TACGTTGTGT TTCAGGACGA CCAATAACAC TACGAGTGAG GGTAATTTGT 7560 

AATTTAGCCA TAACTAGTTT TCCCTCCTTA ATTGTATAAT TCTTCTACTG TTTTGCCACG 7620 
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CATGTTGATT GGTGTGTTTG ATCCTAATGA TTTACTTAAG ATATCAGTGA TACCTGCTAA 7740 

TTCAAGTACG GCACGAACAG GACCACCAGC GATAACTCCT GTACCAGGTG CAGCCGGTTT 7800 

5 CATAAATACG CTTCCTGAAC CGTAACGGCC AGTAATTGTG TGTGGAGTTG TACCTTCAAC 7860 

ACGTGGAACA ACTACTAAAT CTTTTTTAGC TGCTTCAACA GCTTTTTTGA TTGCTTCTGG 7920 

TACCTCTTGA GCTTTACCAG TACCGAAACC TACACGACCA TTTTTGTCTC CAACTACAAC 7980 

10 TAATGCAGTG AAACGGAAAC GACOACCACC TTTTACAACT TTTGCTACAC GGTTGATTGT 8040 

AACAACGCGT TCTTCAAATT CTTTCGTCTC TTCTTCtCTA CGAGCCATGT ATTTGTCCCT 8100 

CCTTTAAATT AAAATTCTAA TCCGCTTTCT CTTGCTGCTT CAGCTAATGC TTTAAcACGT 8160 

75 

CCGTGATATA AATATCCTCC ACGGTCAAAT ACGATTTCTT TAATGCCTTT GTCAGCAGCT 8220 

TTTTTAGCAA TTGCTTCACC GACTTTAGTT GCTAATTCAA CTTTAGTTGC TGTAGTAGCA 8280 

2Q ATGTCGCTGT CTTTTGAAGA AGCTTGAGCT AATGTTACGC CTTTATTATC ATCAATAATT 8340 

TGAGCGTAGA TATGCTTGTT TGAACGATAT ACGTTTAAAC GTGGCTTTTC AGCTGTACCT 8400 

GATAAGTTAG TACGAACACG AGCATGTCTT TTTAAACGCA CTTTATTTTT ATCAATTTTA 8460 

25 CTGATCATTT CAATACTCCT TTCTTTAGAG TTTATCTATT ATTTACCAGT TTTACCTTCT 8520 

TTACOGOOAA CGTATTCACC TTGGTAACGA ATACCTTTAC CTTTGTAAGG CTCTGGAGGT 8580 

CTTACTGAAC GGATGTTAGA TGCTAATGCT CCAACTTGTT CTTTTGAAAT ACCTTCAACT 864 0 

an 

TTAACGACTG TGTTTTTCTC AACTGAGAAA GTAATGTTTT CTTCAGCTTT AATTT CT ACT 8700 

GGGTGAGAAT AACCAACGTT AAGGATTAAG TCTTTACCTT GCATTTGAGC ACGGTAACCT 8760 

ACACCAACAA GTTCAAGTAC TTTTACGTAT CCTTGAGAAA CACCTTGTAC CATATTGTTT 8820 

35 

AATAAAGCAC GAGTTGTACC ATGGTTTGTT CTATCTTCTT TAGAATCAGA TGGTCTTACA 8880 

ACTTCAATTG TGTTTTCTTC TTGTTTGAAT GTCATTCTTT CATTTAAAGT TCTTGATAAT 8940 

TCACCTTTAG GACCTTTAAC AGTTACATGA TTTCCATCAA AAGTTACTGT TACGTCACTA 9000 

40 

GGGATGTCAA TAATTTTCTT ACCAACACGA CTCATGTTAT GGCACCTCCT TATTTTTTAT 9060 

TACCAAACGT ATGCGATAAT TTCTCCACCA ACATTACGTT TTCTTGCTTC TTTGTCAGTG 9120 

45 ATTACACCTT CAGAAGTTGA TACTAATGCA ATACCTAAAC CATTTAATAC TTTAGGCATT 9180 

TCGCTAGCTT TTGCATAAAC ACGTAAACCT GGTTTTGAAA TACGTTTTAA TCCTGTGATA 9240 

ACACGCTCAT CGTTTTGACC ATATTTTAAG AATAAACGAA GTACACCTTG TTTATCATCT 9300 

£/) . . 

TCTACGTATT CAACATTTTT AATGAAACCT TCACTCTTTA AGATTTCAGC AATTTCTTTT 9360 

TTAATATTTG ATGCAGGTAA TTCTAACTTC TCGTGACGCA CCATGTTTGC GTTTCTTACA 9420 
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TCTTTTTTAT TACCAGCTAG CTTTACGAAC GCCAGGGATT TGGCCTTTGT AAGCTAATTC 9540 

ACGGAAACAA ATACGGCATA ATTTAAATTT ACGATATACA GAATGTGGAC GGCCACAACG 9600 

TTCACAACGA GTGTATTCAC GAACTGCATA TTTTTGTTTT TTTTGTTGCT TAGCAACCAT 9660 

TGAAGTTTTA GCCACTTAAT TAGCCTCCTT TAAATAATTA TTTACGGAAT GGCATACCGA 9720 

AGTTAGCTAA CAATTCACGA GCTTCTTCAT CAGTGTTAGC AGTCGTTACG ATAACAATAT 9780 

CCATTCCTCT AACTTTACTT ACTTTATCAT AGTCGATTTC TGGGAAAATT AATTGTTCTT 9840 

TAACACCTAA AGTGTAGTTA CCGCGTCCGT CAAATGCTTT TTTAGAAACA CCTTGGAAGT 9900 

CACGTACACG TGGTaATOAT ACTOAAATTA ATTTGTCTAA GAATTCATAC ATTCTTTCAC 9960 

CGCGAAGTGT TACTTTCGCA CCGATTGGCA TACCTTCACG TAAACGGAAA GTCGCGATTG 10020 

aTTTTTTAGC TTTAGTTACT AATGGtTTTT GACCAGTGAT CAATTCTAAT TCTTCAACAG 10080 

CATTGTCTAA TACTTTAGAA TTTTGTACTG CGTCACCTAC ACC CATGTTC ACAACGATTT 10140 

TATCTATTTT TGGTACTTCC ATTACTGAAC TATAATTGAA TTTTTTCATT AAGTTTTCAG 10200 

TAACTTCAGT GTTaAACTTT TCtTTTaAAC GGTTCaAAGT GGGATCCTCC TTTCaACTTG 10260 

TtATTAATTA TTAGAkTTAA TTTCTTCGCC AGATTTTTTA GCGATACGAA CTTTTTTACC 10320 

ATCAACAAAT TTGTAACCTA CACGAGTTGG TTCGTTTGTT TTAGGGTCCA ATAATTGTAC 10380 

ATTAGAAACA TGGATTGCTG CCTCTGTTTC TAAGATTCCA CCTTCAGGAT TTAATTGAGT 10440 

TGGTTTTTGG TGTTTTTTCA TAATGTTAAC ACCTTCCACA ACGACACGGT CTTTTTTAGG 10500 

TAGAGTAGCA ATTACTTTAC CTTCTTTACC TTTGTCTTTA CCTGCGATAA CTTTAACGTT 10560 

GTCACCTTTT TTGATATGCA TGTGGGCACC TCCTTATTTG TATTGGTTGT TATTAATTAA 10620 

AGTACTTCTG GTGCTAATGA TACGATTTTC ATGAAGTTAC CTTCACGTAA TTCACGAGCA 10680 

ACAGGTCCGA AGATACGAGT ACCACGTGGG CCTTTGTCAT CACGGATGAT AACACATGCA 10740 

TTTTCATCAA ATTTGATGTA TGAACCGTCA TTACGACGAA CACCTGACTT AGTACGTACG 10800 

ATTACAGCTT TGACAACGTC ACCTTTTTTA ACAACGCCAC CTGGTGTTGC ATTTTTAACA 10860 

GTACATACGA TAACATCGCC GAT G TTTGCT GTTTTACGAC CAGATCCACC TAATACTTTG 10920 

ATTGTAAGAA CTTCACGAGC ACCAGAGTTG TCTGCTACTT TCAAGCGTGT TTCTTGTTGG 10980 

ATCATTAGTT AAACCTCCCT TATCTCTAAA CTTGTATTAA ATAATTACTG ACTCTTCAAC 11040 

AATCTCTACT AAACGAAAAC GTTTTGTTGC TGATAAAGGA CGAGTTTCTT GAATTTTAAC 11100 

AATGTCTCCT AATTTAGCTG AATTGTTTTC ATCATGAGTT TTGTATTTTT TAGAGTATTT 11160 

TACTCGTTTA CCGTATAATT TGTGTGTTTT GTAAGTTTCA ACAAGTACTG TAATAGTCTT 11220 
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TTTTOTAACC 
CGAGCAACAG 
TCTAATTGAC 
ATTTGTTCTT 
ACCACCCAAT 
AOGTAGTGcT 
TGGTTTAACA 
TAAAGGTTTT 
TTTCATGTAA 
CGTTGTTGTA 
CCAGTTGTTT 
ATTTTCCTCC 
TAACGCCTAA 
GTAACGTATG 
CGCCTAAACG 
TGATTGCTTG 
TTTCAGCTAC 
CTTTTTTATC 
. TACCAATTAC 
GTTCAATCTC 
TTTTTAAATC 
AATCACGGAT 
CTCCTTAAAA 
AATGTGGCTT 
TTTTAATGTT 
GTCATAGTTA 
TGAAGCTTTG 
TAAGTCAAGA 
TGCTTCCATT 



TCCTCTTACT 
TTTTTAGACG 
CTGTAGCTAA 
CGATTTCTGA 
TCCTCACGTT 
TCACGCGCAA 
ACTGCGATCC 
TTAGTATATG 
CGTGTCATTG 
GCTTGTAAAC 
TAGGACGATG 
TCCACTAGTG 
TTTACCGTAA 
AAGTGGAACA 
ACCAGATACT 
TTTTTGTACA 
TAAACGAGCG 
AGTTAACGCA 
CATACCAGGT 
TACGTGAGAA 
TTCGTGTAAA 
AATACCAACA 
GTTAATTAAG 
GTACGTTTGT 
GGTCCTTCGT 
TGTTCAGCAT 
TTTGTTAATT 
ACTAGTCTTA 
AGGATGTCCT 



TAATTATTGA 
TGCAATCGTT 
CTGAAAGCGT 
AGTGGTTAAG 
TTACAAACTT 
CTTCTTCAGA 
AGCCTTCAAC 
GTGTATGTGG 
CTATACGAGC 
CAAACTCACC 
TTGACGAOGA 
TTCTTAGTAG 
GTAGTGTCAG 
GTTCCTTCTG 
TGaGTTTTGA 
CGACGGAATG 
TCAAGATCAA 
TTTAATTTGT 
TTACCAGTAT 
ACTGATGCTT 
AGTGAAGCGA 
CGAAGTCCGA 
CTTCTTTAGC 
TAATCGCACT 
TAGCATATGC 
TAGCTAAAGC 
TTAAAATTGC 
CTTTACGAGG 
CCTCTACTTA 



TTAGCCTTAC 
TTTCTTACTG 
AGGTTAAAAA 
TCTCTAATTT 
AGTTTTTACT 
AACGCCAGCA 
CGCACCTTTA 
GAAGATTTTA 
AGATTOGATT 
AAAT6TTACG 
TATTTTACAC 
GAAGAACTTC 
CTTCAGCGTG 
AATATTGTTC 
TACCTTTAGC 
AAGCACGGTT 
CTTTTTTGAT 
TGCGTAATTT 
GAATTGCAAT 
CTTTTAATTC 
AGTCTTTTTC 
TTGGATTAAT 
TTCTTCTTTA 
TGCACGACCT 
TTCTTTAACT 
GGACATTAAT 
AATAGCTTCA 
TGCGATTCTT 
ATAGATATTA 



TTTGTTCAAT 
TACGAATACG 
GCTCTTCTTT 
CCTTAGCTTT 
GGAAGTTTGT 
ACTTCGAATA 
CCAGCACCCA 
ATCCAAACTT 
TGACGAGATG 
TAtTACCGCC 
GTTTTGGTAG 
TCCACGATAA 
tGCATAATCG 
AGCACGAGCG 
ACCAAGTTTC 
TTCTAATTGA 
TTCAATTACG 
TTCGATTTCT 
GTTGATACGG 
ATTATCAATA 
AGCATACCAT 
TTTTTGACCC 
CGGTCACTTA 
TGCGCACGTG 
ACTAATTCAT 
ACTTTTTCAA 
GCAGCATTTT 
ATTGTTCTAG 
TCTTCTTGTT 



TTCTCTTTCA 
TGCAGTTTCT 
TGAAGATTTG 
CATTTGTTTC 
GACTTGCTAA 
AAATTCTACC 
TACGTACTTC 
TCCCGCCACG 
TGATCCAAGA 
TTTAGAACGA 
TAACATTATT 
ATCCATACTT 
ATGTCAGCAC 
ATGTCAGCTC 
ATAGCTCTAG 
CGTG CGATGT 
TTGATGTGTA 
GAACCGCCTT 
TTTGCAGCAC 
AATTTACGGA 
TTAGCTTCCC 
ACAGTATTCC 
CGACGATTGT 
GACGGAAACG 
CTGTGTTCAT 
TTACTGGTGA 
TACCTCTGAT 
CAACCGCTTT 
TTCTTGTCGT 



.11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
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TATCTTCAGT TACATATACA GGTACGTGTT TACGTCCGTC GTATACTGCA AAAGTATGTC 13140 

CGATGAAATT AGGGAAAATT GTAGAACGAC GTGACCATGT TTTGATTACT TGTTTCTTTT 13200 

CGCTTCCTTC TTGAGCTTCA ACTTTTTTCA TTAAATGCTC ATCGACGAAA GGTCCTTTTT 13260 

TAATACTACG AGCCATTTGG GCGCCTCCCT TCTTATTATG TGCGTGCAGC TTTAAGCCGC 13320 

ACACCCAAAT AAGTTGATTA TATTATTTTT TCTTACGTCC ACGAACGATA AGTTTGTCTG 133 80 

ATGATTTTTT ACCACGACGA GTTTTCTTAC CAAGCGTAGG TTTACCCCAT GGTGACATTG 13440 

GAGATGGTCT ACCGATAGGA GCACGACCTT CACCACCACC GTGTGGGTGA TCGTTAGGGT 13S00 

TCATTACAGA ACCACGAACT GTTGGACGGA TACCTTTCCA TCTTGAACGT COGGCTTTAC 13560 

CAACGTTAAC TAATTCGTGT TGTAGGTTAC CAACTTGACC GATTGTAGCA CGGCAAGTAG 13620 

ATAAGATCAT AOGAACTTCA CCAGATCTTA ATCTGATTAA TACGTATTTA CCTTCTTTAC 13680 

CAAGTACTTG AGCACTTGCA CCAGCTGAAC GAGCGATTTG TCCACCTTTA CCAGGTTTAA 13740 

GCTCGATGTT GTGTACTACT GTACCAACTG GAATGTTTTG TAATGGTAAT GCGTTACCAA 13800 

CTTTGATGTC AGCTTCAGCA CCACTTTCAA CGATTTGACC TACTTCTAAT CCTTTAGGAG 13860 

CAATGATATA TCGTTTTTCA CCGTCTGCAT ATACAACTAA AGCGATGTTT GCTGAGCGGT 13920 

TTGGATCATA TTGAATAGAA TCAACTTTTG CATTGATACC ATCTTTGTTA CGTTTGAAAT 13980 

CGATAACACG GTATTGACGT TTGTGTCCAC CACCATGGTG TCTTACAGTC AATTTACCTT 1404 0 

GGTTGTTACG TCCCGCTTTT TTCGGTAGCG GTTTTAATAA TGACTTTTCA GGTGTAGTTT 14100 

TCGTGATTTC TGCGAAATCT AACGAaGTCA TATTACGACG ACCATTTGTT ATTGGCTTAT 14160 

ACTTTTTAAT AGCCATTGTC GCTTACCTCC TTAATGGTAA TTGTTTTATT AGTTAAATAA 14220 

GTCGATTGAT CCTTCTTTAA GAGTTACAAT CGCTTTTCTT CTTTTGTTTG TATAGCCTTG 14280 

GTAACGGCCC ATACGTTTTT TCTTAGGTTT GTAATTCATG ATATTAACAC TTGCAACTTT 14340 

TACGTTGAAG ATTTCTTCAA CTGCCATTTT TACTTGTGTT TTGTTAACAC GAGTATCAAC 144 00 

GTCGAAAGTG TATTTGTCTT CAGCCATTGC TTCAGAAGAT TTCTCAGTGA TTACGGGGCG 14460 

CTTAAGAATA TCTCTTGCTT CCATTATCCG AGCACCTCCT CAACTTTTTT AGCAGCAGCT 14 520 

TCAGTAATTA CTAAGCTGTC AGCATTAGTG ATATOTAAAA CATTTAAACC TTGAGCAGTT 14580 

GTCACTTGAA CGCCAGGGAT GTTGCGTGCT GATAATTCAA CATTTACATC TTCGTTTTCA 14640 

GTAACTACTA ATACTTTTTT AGGTTGTTCT AATGTAGATA ATACATTTTT GAATT CTTTA 14700 

GTTTTTGGAG CTTCGAAGTT GAATGCGTCA ACTACAGTTA AGCCATTCTC TTGAGCTTTG 14760 

AAAGATAATG CTGAGCGTAA AGCTAAACGA CGCATTTTCT TAGGCATTTT GTATGCATAA 14820 
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CCTTGACGAG CACGACCTGT TCCTTTTTGC TTCCATOGTT TACGTCCGCC ACCGCTTACT 14940 

GCTGAACGAT TCTTAACAGC ATGCGTACCT TGACGTAATG AAGCACGTTG TAAATTAATA 15000 

GCTTCGAATA AAACGCTATT ATTTGGCTCA ATACCGAATA CTGCATCGCT TAATTCGATT 15060 

GAACCTGATT TAGTTCCGTC TAATTTTAAA ACATCATAAT TAGCCATTAT GCATTTCCTC 15120 

CTTTCACTTC TTATTATTTA TTACCTTTTT TAATTGAAGT TCTGATTTCT ACTAAACCTT 15180 

TTTTAGGTCC AGGTAOGTTA CCTTTTACTA AGATAACTTT GTTTTCTGTG TCAACTTGAA 15240 

CTACTTCTAA GTTTTGAACA GTTACAGTGT TTCCACCCAT ACGTCCTGGC ATTTTTTGGC 15300 

CTTTAAATAC TCTAGAAGCA TCTGAAGCCA TACCTACAGA ACCTGGTGCT CTGTGGAAAT 15360 

GAGAACCGTG TGACATAGGT CCACGAGATT GTCCGTGGCG TTTAATTGCA CCTTGGAAAC 15420 

CTTTACCTTT TGATACGCCT GTTACGTCAA TAACGTCGCC AGCTACAAAA GTATCTACTG X5480 

AGACTTCTTG AaCCTAcTcG TAAGCATCCA CGTCTACATT GCGGAATTCA CGAATGAAGC 15540 

GCTTAGGTGC TGCGTCAGCT TTTTTAGCGT GACCTTCAGC TGGTTTATTA GCATATTTAT 15600 

TAGATTTTGC ATCTTTTTTG TATGCTTTTT TGTCTTCAAA TCCAACTTGG ATTGCGTTGT 15660 

ATC CATCAAC TTCTACAGTT TTCTTTTGTA ATACAACATT TTCTTTAGCT TCTACTACTG 15720 

TTACAGGGAT TAATTCACCG TTTTCTCCGA ATACTTGTGT CATCCCAATT TTTCTTCCTA 15780 

AGATTCCTTT GGTCATCGAA AGTCCACCTC CTAAAATTGT CTATTATAAT TTGATTTCGA 15840 

TGTCTACACC AGATGGTAAG TTTAAGC CCA TTAAAGCGTC AACTGTTTTT GGTGTTGGGT 15900 

TTACAATATC GATTAAACGT TTGTGTGTAC GTTGTTCGAA TTGTTCACGT GAATCTTTAT 15960 

ACTTATGCAC GGCACGGATG ATTGTGTAAA CTGATTTCTC AGTTGGTAAC GGAATTGGTC 16020 

CAGAAACATC TGCACCAGAA CGTTTCGCTG TTTCTACAAT CTTCTCTGCT GATTGATCAA 16080 

TTACSCGGTC ATCATAAGCT TTTAATCTGA TTCTGATTTT TTGTTTTGCC ATAATTTTCC 16140 

CTCCTTATTC GTCTACATTT AGTGATAGAC TTCTCCACGA AAACTATCTT ACACAGCGCC 16200 

ATGGCAAAGC GGCCGGGTGT GTCAGTAACC TTTCGCTTCA TCGCTTTTCT TAAAGTCCAA 16260 

CGTTAGTTAT ATTACACGAA AAACATCGAT AAATCAAGGC TTTTCACATA ATTTTTCTAT 16320 

CTGTCTAACA CATACTTTTA TATTTnACTT TATATACTTA GTCAGTTCAA CTATTTTCGA 16380 

GATATTTTnA ATTTCCn 16397 
(2) INFORMATION FOR SEQ ID NO: 206: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 29555 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
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(Xi) SEQUENCE DESCRIPTION; SEQ ID NO: 206: 

TnAGTTGTTT CTGCCACGAA AGATTCAATG GCTTTTCTTG CTTTACGCTT TTCTTTCAAT 60 

GGCAAATCAC CAATCATTTT TTTAAGGTGA TGTGGQTTTA CAACACCACT ATACTGGTAG 120 

TCATTTGAAn TTGTTTTTAG GGCTTGTTCA TCGATAGATC TCTCTCCAGC AAATCCTTTG 180 

AACTCCGCTT CTTTTTTAAT ACTTTCGAAA TTAACATATT CTTGATCGAT ATCATCATCC 240 

TTATTTAAAG AAGGTACAAC ATTGTCGATG AATTCTCTAA TTAGATCTCG TTTTAACCTC 300 

AATGtCGGAT CATCTGCATG ATCTAAAATG CGTCTAATTT GTTCTTGGTT ACGACGTTGT 360 

TCCGCTTTGT CTTCAAGATC AATTTGTCTC AATATATTCA TAATATAATT CACATTAATC 420 

GTATCATTAC GCATCATTTC TATTTCGAAA TCAATATCAT TTAAAATGGA TACTTTATTT 480 

20 TTCTCAGCCG TCGCTCTTTT TACTTGATCG TACACAGCTA AATATTTACT TTTATAGTCT 540 

TCATTCTCTT GTTCATCCAT TCCAATTTCA TCAATTGTAA ACTCAAACTC GTCAAATGCT 600 

TTTAAACGTA ATATTATTTT AGCTAATAAA CGATAAGCtT CAACAAAGCG CTTTAGCTCT 660 

TCTTCATCtT GaATGtCATC AACCATGTGT GGTGTCGGCA CAATCATTTT AAGCTCACGA 720 

TAAGCGTCCA TAAATTCTTT TTTATACTCT TCATAACTGC GCATTAAAAT TGTATCCGTA 780 

TCATTTGTTT GTGAGAATAC TCTCAGTGCA TCGTCTGTCT CTTTTTTCAA GT CACGAT AG 840 

TTTACAATTT TACCAAATGG CTTTGATTCT TTTTCAACCC TATTTGTACG TGAATACGCT 900 

TGAATTAAAT CATGATACAT TAAATTCTTA TCAACATATA AAGTGTTCAG TACTTTACTA 960 

TCAAAACCAG TTAAGAACAT ATTAACAACG ATTAAGATAT CAATTTTACT ATCTTTAACG 1020 

CCCTTTTTAA CGTTTTTtGA AATATGATTA AAATACTCAT TAGTTGtGGC TGnTGaAAAA 1080 

TTCGTCTCGA ACTTTTTATT ATAATCACTA ATCATTATCT CTAATTTTTC ACGTGAATGA 1140 

TATGGCACTT CACCATCACG ATCATCTTCA TTAGGTTTAA ACGTAAATAT ACCAGCTATC 1200 

GTTAACGGTT GTTCCAACTT TTTGTTAAGT CGCTTAAATG TCTCATAATA TTTAATAAGC 1260 

GCGTGAATAC TTTGGACTGT AAATATACTT GAATATTGAC GATTACGTGT ATATTTATCA 1320 

TGATTATTGA TGATATGTCG TGTTACTAAT TCCACACGTT TATCCGCTAA CCATACTTCT 1380 

TCCGTATCAA TTGCTTCAAC CATGC t GTTA TCTTCTGCTT TTAAAGCTTT ATTTTTAAAA 1440 

GTATTAATAT AGTCAACTGA GAAACCAAGT ACATTACCAT CATGAATGGC ATCTCTAATT 1500 

AAATACGTAT GTAAGCATCT ACCGAAAATA TCTGCAGTTG TTCTACCATC TTGACTACTA 1560 

TTTTCTGGAA AACGTGGCGT ACCAGTGAAT C CAAAGT ATT GGGCATTTTT GAAATGTTGT 1620 
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ACTTTATTCG TTTTATACTG TTCTAATAAA GGGGCATTCC CTTGAATCGC TTTAGCCATT 1740 

TTTTGAATCG TCGTTACAAT AAGTGGCAAA CTTTTATCAT TTAGTTGGCG TACCAGTTGC 1800 

GAGGTATTAA AAGTTTTGTC TACAGCACCC TTAGCAAATT TATTAAATTC CTCTTCTGTT I860 

TGACTATCCA AGTCTTTACG GTCAACCAAA AAGATAACTT TCTTAATGTC ATCTTOCTGT 1920 

GATAAAATCT GACTCGCTTT AAAAGAAGTC AACGTCTTAC CACTTCCAGT TGTATGCCAT 1980 

ACATATCCAT TATTCCCTGT CTCAGTCGCT TGTTGAATAA GTGCTTCTAC CGCATACACT 2040 

TGATACGGAC GCATTGCCAT CAGTATTCTA TCTGTTTCAT TAATAATCAT AT AG CGCGAT 2100 

ATCATCTTAG CTAATTGACA AGGTCTCATA AATGACTCAG CAAACGATTG CAATGTATTG 2160 

ATACGGTTAT TCTGTTTATC ACTCCAATAA AACATGTGAC TCTTCAATAG TTCGCTATCA 2220 

TTATTAGAAA AGTATCGCGT TTCAACACCA TTACTAATGA TAAACATTTG TATGTAGCGG 2280 

20 AATAAGCCTG TGTAATTTTG TTTGCGGTAA CGTTTTACTT GGTTAAACGC CTCATTAATA 2340 

- TCAATACCTC GACGTTTCAA TTCAACTTGG ACAAGGGGTA GTCCGTTGAT TAATATCGTT 2400 

ACATCATAAC GTGCTTTATA TGTATCCTCG ACAGATACTT GATTCGTCAC TTGAAACTTA 2460 

25 TTTTTACACC AACTTTTCGT ATCTAAAAAC GACAAATAAA TCTCAGACTC ATCATCACGT 2S20 

CTAAGTGGTA ATTTATCACG TAAAATACGG GCACTCTCGA AAATACTTTT TCCATCAATC 2580 

ATCGTTAACA GACGTTGaAA TTCTTTATCT GTTAaGGGAT TGCCTTCTAA TTTGTCCGCA 2640 

TGACGCTCAT TTAAAATCGT TCTAAAATTA TCAAGCAATT GCTTATTATC ACGTATCGTT 2700 

ACTCTTTCGT AACCCAATTG TTCAAGTTGA TTCATCATTT CATTTTCTAA TGCGTATTCA 2760 

CTTTGGTATG CCATTCATAT CCCCTTCCAT ACACTTTCTA TTGCTCTAAA TATATCATAA 2820 

ACTTTAATGA AAAATGTTTG TTTTTTATCT TCAAACGTAA ATTTATTCTA ATTTTATTGT 2880 

CTTAXCTTTT AATATTTGTC TTTGAGGTAA GTCGTATACT AAAATTTGAA TACAAATAAT 2940 

CAAATCATTG ATAAATTTTT TGTCTACGAT TAATGGAGGG ACTTGAATGG TGTTAATTAC 3000 

CTATCAAATC ATTTTATTTT TTATTATTAG TCTAAGTTAC TATTTAACTT TAAATCATTA 306 0 

CATGGCAGTC ACTGTAGGTA ACTTCACTTC AATATTCGG C ATGTTCGCAG CCATACTCTT 3120 

45 TATGTACTAC TACCTACTCT ATAAAAGTCC CGAATACAAT CAACGCAAAC GATTTAAACA 3180 

TTTCATTCAT ATCACTAATT TGATAATAAT TGCTTTTAGC ACCTTCGTAT TAGTTCATTT 3240 

AGCATTAAAA TTATTCTTCA GCATTTAATT TCCATCTATG AAAAAAGCAA AGCTCAAATC 3300 

60 

TGAACTTTGC TTTAATTTGT CACGCCTTTA TCATTTTCAA AATAGCCTCT ATGCCAGTTT 3360 

TACAAACTTG TAGCAACAAT TTTTCATCAA GCAACTGAAT CACATCAAAA ACTTCAATTG 3420 
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GTCGCAAGAT GCTTCCTGTA ATTATCAAGT 
ATCOCATGAT AATTTAATGC TACAAATCGA 
5 GCAAATAGTG AOGTTGTAGC CGCCATACGC 

AATGCATAGT CTGCAATTTG AGCCACTGGA 
GGAATACTGT AATGTGTGGC CACCTGTGCA 

10 

TTCGTCACAA AAATCATGCA ATCTCTATCA 
TGCGTTTCAT GTAATAACCT GACATTTAAG 

1S CCAATAGTCA AACTCGATGC GCCAAATCCA 

ACATCACAAA TTGCATCAAT TTGCGCATCC 
TTCGTTGCTC TAGCAATCAT TTTATTTTTC 

20 TCTAAATGTG GATTGGTTGC AATAT CTTCG 

TCTTGAAAAC CTTGATGTGT CATTTTCCGA 

TTCGTAACAT CTGCCAAATC ATTCACAGTC 

2S 

ATGTAATCAG CGATTATCTT TTCTGTCTTC 

TATAAAATAT TTGTCATCAT TAATCACCCA 

TTCCAAATAA ATATGTACAA ACGAATCCAC 

30 . 

AACCTAAATA CATATTATCT GAGATTAATG 
CTTTGGCACC AATATGTCCA ATTCCACCTA 
AAGCAGTTAA GAAAGGTCGA CCTAATGGCA 

35 

TACCTAGGAA ACCAACTGGC AATGCACCTT 
TACATCTTAC CCAAAGTGCT AATGCGGCAC 

40 TTGGCAATAA GTAAGT AG CA CCTGATTGGT 

TATGATGAAG CCCTAACATA ACTAACGGTA 
ATACGCCACC AATACTAATA ATTCCGTTAA 

45 CTGCTAATGG CATAAAGATA AAGATAGTTA 

GCGTTACAAT AATATCAATC GCATTTGGCA 
TTAAAATCCA AACGGCAAAA ATAACGCCAA 

SO 

CTCCAGTGAA GACATTCATT AAAATATTTT 
CACCAATCAC GCCACCAAGT CCTGGTGTCG 
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GCCATTTTCG ATTGGGTTAT ACAATCTAGA 354 0 

TAGTACAATA TATCTACCGT GAATAACTGT 3600 

ATTTCATTTT CATCAGTTCT GCCATAAATC 366 0 

TTATTAGCTG TACTAGATAT AGTTATGATG 3720 

ATTGACTGCA ATTCACTATG ACTACCTTGA 3780 

TCATGCGTCG CAAATGTTGA CACAAGTAAA 3840 

CCAATACGAG ATAACTTTTG AAAAAGATCA 3900 

AATAAAAATA TTGTCCTGGc ATTTTTCAAC 3 960 

ATAATATTAG TAGCTACAAA TCGCATCGTA 4020 

AAAGTTTCTA CAGATTCATT TTCAATCAAT 4080 

GGTAAGTATC GAGATATCGC AATCTTTAGC 4140 

CTAAATCTAA CAATTGATGC TGTACTAACA 4200 

ATATCAATGA TTTTATGTGG ATTCTTTAAA .4260 

GTAAAATCAC TCAACTGCTT ATCAATGCGA 432 0 

ACAAATCTGT CTGTCGCATC GCCTTTGTCG 4380 

CAGCATACGC AGCAAGTAAT CCTGCAATAT 4440 

GTAATAGTGA CACACCACTT GGGCCTATTG 4 500 

TTACAGCGCC ACCAATACCA CCACCAATAC 4560 

AAGTCACACC ATAGATTAAT GGTTCTCCGA 4620 

TTAAAGTATT ACGTAATGTT GTGTTGCGTT 4680 

CTACTTGTCC AGCACCAGCC ATCG CTGCAA 4740 

TAATCATTTC TATATGAATT GGCGTAAAAA 4800 

GGAAGCTTGC ACCAATGATA AATCCACTAA 4860 

CTACTGAAAC TAAACTGTCT GAAACAAAAC 4 920 

ATAGTCCTAC AATCAACAAT GCAATAGTCG 4 980 

CAATTTTATG TAATCTCTTT TCGACAATAC 5040 

TAATCCCACC TTGTCCAGGT TGCAATGGTT 5100 

TACCAGCAAT ACCCGTTAAT AACGTTGTAC 5160 

CACCAAATTC TTTAGCCGCA TTAATACCAG 5220 
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GOGTAATCCA AGCACCTGAA ATATAGCCTG CCACCATTAA GTTACTCAGT ACTGCTGCAA 5340 

TACCACCAAT TAATCCAGCT CCAATAAATG CAGGAATCAA CGGTATAAAG ATATTGGCAA 5400 

TTGATTTCAA TACTTTATTC AACTTACCAT TCTTTTGTTT TGCTTTATGC GCTTCCTTAT 5460 

TCGCCTTTGC TTTATCAGCT GCATATGATT TATAGTCCAT TTTTTCACTA TCATTGTGAT 5520 

GGTGTGGTAT TGGGTCACCT AGTTTAACAC CACTTAATTC CGCCATATGA TTAGCCACTT 5580 

TATTGa t GTA CCAGGTCCAA CCACAACTTG AATGCGTTCA TCGTGTATAA CACCCATGAC 5640 

ACCATCAATA TGCCTTAGTT CTTGGTCATC TACTTTATTC TCATCTAATA CTTTAATACG 5700 

CACACGTGTC ATACAGTTCA TGACACTATC TATATTATCC ATACCACCTA CTGCAGCAAT 5760 

AATTCGTTCT GCAAGTTGTT GTTCTTTGGT CATTTAAATC CCTCCTAAGG TTGTCTATCT S820 

CTGATTGCTC GTTTAAaATG TCACCATTGT TTAATAACCG TCTTGTTGCT TCTTCCTTAG S880 

AAATGCCACA CATACCCATA ACTGTCGCAA CTTTCACATC ATGCTCAGAT ACCTGATATA 5940 

ACGCCATTGC TTCATCATAT GTGATAGCAC ATATTTCTTG AATAATACGC ACTGAACGGT 6000 

CGATCAGTTT TTGATTGGTT GCTTTAACAT CAATCATGAG GTTATCGTAA ACTTTTCCGA 6060 

CACCAACCAT TGTGATGGTT GAAATCATAT TTAAAATTAA CTTTTGTGCt GTACCAGACT 6120 

TTAAACGTGT TGAACCAGTT AATACTTCTG GACCAACTTT AACTTCTACT GGATAcTGCG 6180 

CAATTTCACT TATAACTGCA TGTTCATTGC ATGAAATAGA TACTGTTGTA GCACCGATTG 6240 

TGTTAGCAAA TGTTAAACCG CCTATAACAT ATGGCGTTTT GCCACTCGCG GCAATTCCTA 6300 

TAACGACATC TTTTGATGTT AAATCTATAT TTTTCAAATC TTCTTCCGCT AATTTTTTGT 6360 

GATCTTCCGC ACCTTCTACA GCCATCGTCA TAGCATGTTG TCCACCAGCA ATAATACCTA 6420 

TAATTTCATG AGGGTCAGTA TTGAATGTAG GTACACACTC CGCTGCATCT AAGACACCCA 6480 

ACCTTCCACT TGTACCTGCA CCGATATAAA TCAATCGTCC ACCCTTTTTA TACTGTGCAA 6540 

TTCTTTTTTT AATTACTTTT GTCAATTGTG GTATTGCCTT TCGAACTGCT AACGGGACTT 6600 

GCTGATCTTC TTTATTCATC GTAATTAAAG CCTCTTCCAC AGTCATTTCA TCAAGATGCA 6660 

TCGTCGCTTC ATTACGCGCT TCGGTCGTAC TATTTTCCAT CACTTCTTAC ACTCCCTAGT 6720 

TTTTTGAAAA TCAAATGTAT CATTCGGCTC GATACAACTT AACAGTGGTA AGTCTTCTTT 6780 

AATAATTTGT GCAaCAACAT TCACATTGTC ATGTGCACTA AGCGTTTGTC TCACAATTTG 6840 

CATTTCGCCT TGATAACGTC CGTTATTCAA ATTATCAACG GTTACTGAAC CAATGCGTCG 6900 

TTGCGTCGTA AACTGTGGTT GAATCGAATG TGGACATATT TGTCTTGACG TTTCCGAACG 6960 

AATGACATTT TCCGGATTAT CCGGGCGTAC TTTATGACAC ATATCGAAAA GGTAAGTCAC 7020 
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AAGTTGTTTT GCCTGCCTCA TTTCAATCAA 
AGTTTCTTGT AATAATTTAG CTGCAACGAC 
5 TGGCAAGCCT TTATGCAAAG GACCTCGCAA 

TGCCTTTGGA TTAAATTGAT AAATGAGTTC 
TCCCGTATCT GGTCTTGGAT AATAGTTATG 

70 

TTGTTGATGT AAGCTTGTTA ACAATTCCCG 
TAAACCCTGT GCCATTATCG CTTCGATTGC 

15 CATAAATTGT GCATCATATT GTCOAAGATG 

ATTAGCftTCT ATGAGGTAAG TCACTTOTTC 
ATAATGATAT TTTGTCTCGT CATCTTCTTC 

20 GTAACCTTGT TTAATCATTC GCTTAATATA 

TGAAAAGCCT GTCAAAGTAG CCCTCCTTAA 

TTGTGTAATC GCTTACATTT TACTATAAGA 

25 

GCCTGTTCAT TGTAATAATC TTACATATTT 

GATTATCCTT TCTTTTAAGT GCTGATAATA 

TTATACATTT TATTCAGGAT TATCTTATAT 

30 

AGAGATTTGA AATTGAATTT AATAATTGTA 
AGGAGTCGCA AACAAATAAG ATTCAATAAG 

3S TCGTGTCTTT TTTTATTGAA TCTTAAATAA 

GGAAGAAACT TTTCGGTCAA TTGCAACGTA 
TTTPACCAGC AGCTGGTCTG TT ATT AG CT A 

40 AACACTACTT GCCGTTTATA CAAAATGGTG 

GTGCTGGTGG TATCATTTTT GATAACTTGC 
GATTAGCTGG CGGTGATGGC GTAgcAGCTA 

45 ACAAAACAAT GGGCGACTTT TTACAAGTTA 

GTTACGCTAG CATTTTAGGT ATCCCAACAT 
TCGGGGCCCT GGCAGCTTGG TGTTATAACA 

so 

TAGGTTTCTT CGCTGGTAAG CGTTTCGTAC 
TAGCATTCCC AATGGCATTA ATTTGGCCAA 

55 



TGAGTCTCCA ACTAACACTT CAGATACACC 7140 

AGGATGACTA TGTCTCGTTG CTTCAATTGT 7200 

ATCACTCCCT ACAATAAAAC CATATATTTG 7260 

ATTTTTCTTA TTGACCAAGT CAACAGATAA 7320 

ACAAAATGAA AGTAATGTAA AATCATTCAA 7380 

GGAAATAATA CTTGCATTCA AACAGCACTT 7440 

CTCAATTGAT GTACTATGAT CGATACGAAT 7500 

GTCATAAAAA GATGGTGTTA AAATAGATGG 7560 

ATGTTTTAAT AAATTGAGTA GTTTTGTGAA 7620 

TGGTATTTGT ACAGATGTAA AAATCATTTG 7680 

CGCTTCATCT AAAGGTTGTC CTAAATACAC 7740 

CAATATAATT ATTAGGAAAA TATAGTTGAT 7800 

GAAAACACAT TACAATATTA ATCAGTTAAA 7860 

CTGTCACAAG TTAATTATTA CACCATCAAA 7920 

GCTGCTACTG CTGGATTATT ACAATAACTT 79 80 

TATGTTTTAA TAATAATCTG TGAACAATTA 8040 

TTGAAAACGC ATACTTCACC ATGCTAAAAT 8100 

ATGTGATGGT TACCAACACA GTCTATTTGC 8160 

TAAATACAAC TTTGGAGGTT GGACAAGTGA 8220 

TTGGTAAAGC GCTAATGTTA CCTGTTGCGA 8280 

TCGGTACAGC TATGCAAGGT GAATCATTAC 8340 

GCGTACAAAC TGTCGCTAAA TTAATGACAG 84 00 

CTATGATTTT CGCATTAGGT GTCGCAATCG 84 60 

TCGCAGCATT CGTCGGTTAC ATAATCATGA 8520 

CACCTAAGAA TATTGGTGAT CCAGCGAGTG 8580 

TACAAACAGG TGTGTTCGGC GGTATTATAA 8640 

AGTTCTATAA CATTAACTTA CCATCTTATT 8700 

CTATTATGAT GGCTACAACA TCATTTATTT 8760 

CGATTCAATC AGGATTAAAT GCATTCAGTA 8820 
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TATTAATTCC ATTCGGTCTA CATCACATTT 
CATGGAAAAA TGCAGCTGGT GAAA±TATTC 
5 TTCGTGAAGG CGCACATTTG ACAQCTGGTA 

TGTTCGGTTT ACCTGCAGCA GCTTTAGCAA 
AAGTAGTAGC AGGTTTAATG GGTTCTGCTG 

10 

AACCATTAGA ATTCTCATTC TTATTTGTAG 
TTGATGGTTT ATCATTCTTA ACATTGTACT 

1S CAGGTGGTTT CATCGACTAC TTCTTACTOG 

TAGTCATTCC TGTAGGTCTT GTATACGCAG 
TTGTAAAATT AAAATACAAA ACACCAGGTC 

20 CTTCAGCAAC TGAATTACCA TATGCAGTAT 

AACATTTAGA CGCTTGTATC ACACGTCTAC 
ATGTTCCTGG TTTGAAAGAT TTAGGCGCAT 
AAGCAATTTT TGGTCCTAAA TCTGACCAAA 
GTCAAGTAGT AGAAAATCCT ACTACTATGG 
CAGAAGATAA ATCTGCAACA AGCGAATTGA 

30 

AAGTAACACC ATTATCAGAA GTGCCTGATC 
GTATCGCTAT CAAACCTTCA CAAGGTGAAG 
TGATTTTCCC AACAAAACAT GCAATTGGTC 

35 

TCCACATCGG TTTAGACACT GTTAAATTAA 
AAGGTCAAGA AGTTAAACAA GGTGATTTAT 

40 ATCATGCAAA GAGTGATATT ACGCCTATTA 

ATTTTAAACA AGGTGAACAT GGCAACATTT 
AATGCTTACT ATAAACAGGT GCGTATACCT 

45 CTATTGTATT TTGCAGCATC ATTGATAGTT 

TCATCAATTA AAGCCCCCCT TCATACTCAT 
TTAGCGTTTT CACAACAAAG TCAACTTCCT 

so 

TTAAGTGTAA ATATAGAGAA AAGGTGGCTT 
TAATTGACGC TATTCATCGA GCAGGCGTCG 

SS 



TCCACGCACC GTTCTGGTTC GAGTTTGGTT 8940 

ACGGTGACCA ACGTATCTTT ATCGAACAAA 9000 

AATTCATGCA AGGTGAATTC CCTGTTATGA 9060 

TTTATCACAC AGCTAAACCT GAAAATAAGA 9120 

CTTTAACATC ATTCTTAACT GGTATTACAG 9180 

CACCATTATT ATTCTTTATT CACGCaGTAC 9240 

TATTAGATCT TCATCTAGGT TATACATTCT 9300 

GTATACTACC TAATAAGACA CAATGGTGGT 9360 

TTATTTACTA CTTCGTATTC CGATTCTTAA 9420 

GTGAAGATAA ACAATCACAA GCGGCTACTG 9480 

TAGAAGCTAT GGGTGGCAAA GCAAACATTA 9540 

GTGTTGAAGT TAACGACAAA TCTAAAGTTG 9600 

CTGGTGTATT AGAAGTCGGC AATAATATGC 9660 

TCAAACATGA AATGCAACAG ATTATGAATG 9720 

AAGACGATAA AGACGAAACT GTTGTTGTTG 9780 

GCCATATCGT GCATGCACCA TTAACTGGTG 984 0 

AAGTGTTCAG CGAAAAAATG ATGGGTGACG 9900 

TTCGTGCACC ATTCAACGGT AAAGT ACAAA 9960 

TTGTATCAGA TAGTGGTTTA GAACTATTAA 10020 

ACGGAGAAGG CTTTACTTTA CATGTTGAGG 10080 

TAATCAACTT TGATTTAGAC TACATCCGCA 10140 

TCGTGACACA AGGAAACATT ACAAACCTTG 102 00 

CATTTGGCGA TCAATTATTT GAAGCTAAAT 10260 

TCATAAGGTG ACGCGCCTGT TTTTTCTTTG 10320 

CGCTCTCCCC TTAAATTTTG AATTTTAAGA 103 80 

TTCCTAAAAA ATATTAATTG TTCACTATTG 10440 

TGACCTTACA CTATATTCGA GG CTATCATT 10500 

TTTTTATGAA ACAACGCATT GGAGCTTACT 10560 

ATAAAATTTT TGGTGTTCCT GGTGATTTTA 10620 
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ATGAATTAAA 
TAGTTACTAC 
CTGAACGCAT 
GTAAATATGT 
CACATATAAC 
GTTTAATTAA 
TCGCAATCTC 
ATGCATCAAC 
TCATTACTGG 
ATCAAACACA 
ATCCATATTA 
TGGACAACAG 
GTTTTTCATA 
TTOACGATGT 
TTTCATATAC 
CTGTTGGCAC 
AACCAAATGA 
CATTATACAA 
TACCTGCAAC 
GTGATGGCTC 
AACCGGTATT 
TGTATGAACC 
GTGGTAAAAA 
ATGCAATTAA 
aCGCACCGAA 
ATCGTATACA 
AGATGATTAA 
AAATGGATTA 
ATGTTTTTAG 



CGCAAGTTAC 
ATTTGGTGTT 
ACCTGTCATT 
ACATCACTCA 
CGTTGCACAA 
TACAGGAATC 
TGAAATTGAG 
ATATATAGAG 
ACATOAAATT 
GATACCAGTA 
TATGGGTATT 
CGATTTAATT 
CCAATTCAAT 
TACAAATGAT 
GAATAACGCA 
AGAACCATTA 
TGTCATCATT 
AAACAATACT 
ATTAGGTTCA 
ATTGCAACTA 
ATTTGTGATT 
TTATAATGAA 
TGTTGAAATT 
TGGTCATCCC 
GAAACTCATC 
GGGTATAAGT 
TTTTAATAAA 
TGCCCCATAT 
AAAAAACAAT 



GCAGCGGACG 
GGCGAATTAA 
GCGATTACAG 
CTTGGTGAAG 
GGTTATATCA 
GCCGAAAGAC 
ATACCGACAC 
TTATTAGCAA 
AACAGTTTTC 
GCACAACTTT 
TACGATGGGA 
TTAAATATTG 
ATCGATGATG 
GAAATATCTC 
ACGTTCCCTG 
ACACAACAAA 
GCTGATCAAG 
TTTATAGGGC 
CAATTAGCAG 
ACTGTTCAAG 
AATAATGACG 
ATTCACATGT 
CATGACGTTG 
GATGTGATGC 
GATAtCGCTA 
TTAAGCGAAT 
ACCGCTTTAG 
ACAGCTGAAA 
GGCTTTATCG 



GTTATGCCCG 
GTGCCGTCAA 
GTGCGCCGAC 
GTACATTTGA 
CACCTGAAAA 
GCCCAGTTCA 
CATTTGAAGT 
CTAAACTGCA 
ACCTCCATCA 
CATTAGGAAA 
AAATTGCCGA 
GAGCCAAATT 
TCGTTATGTT 
TACCATCATT 
CGTATCATCG 
CTTATTTTAA 
GTACATCATT 
AACCGTTATG 
ACAAAGATCG 
CTATTTCAAC 
GCTATACGGT 
GGGATTATAA 
AATCATCAAA 
ATTTTGTCGA 
AAGCTTTTTC 
ACTTTATTAA 
TGTTAATCGA 
ATGTCGTTCA 
CTTTTGTTCG 



TCTTAATGGA 
CGGTATCGCA 
ACGTGCTGTT 
CGACTATCGA 
TGCAACAACC 
TTTACATTTA 
GACGGCAACT 
TCAAGCGAAG 
AGAATTAGAA 
AGGTGCTTTT 
AGATAAAATA 
AACAGATTCA 
AAATCATCAC 
GTTAAAACAG 
TCCAACATCA 
AATGATGCAA 
CTTTGGTGCT 
GGGTTCTATC 
TCGTAACTTA 
TATGATTAGA 
AGAACGACTT 
AGCTTTACCA 
AGATTTACAA 
AGTCAAAATG 
ACAACAAAAT 
ACGAATAGGA 
CCTGCAAGAA 
AAACGCTAAT 
CGTGAATTTC 



CTCGCTGCAT 
GGTTCATATG 
GAACAAGGCG 
AAAATGTTTG 
GAAATACCAC 
CCAATCGATG 
AAATATACGG 
CAGCCTATCA 
GATTTTGTAA 
AATGAGGAAA 
CGAGATTATG 
GCAACAGCAG 
AATATCAAAA 
TTATCCAATA 
CCCGATTATA 
AATTTCTTAA 
TATGATTTAG 
GGCTATACAT 
TTATTAATTG 
CAGCATATTA 
ATTCACGGCA 
GCTGTATTTG 
GACACGTTTA 
GCTGTCGAAG 
AAATAATTTC 
CTCTGATATA 
GGTATTCTTA 
AAATTAATAG 
TATGATGGTA 



10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 
11BB0 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
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AGTCGTTTCC ATCATTTATT AGACAAGAGA GATGACGATT 
TTTAGTGCAT TTGTAGGAAC AGATTTGGAC TTACAATTGC 
ATTGTTCTTG GTGGTGTCGC AACGCATATT GGCGTAGATA 
CAATTAAACT ACAATCAGTT TTTTGTTACA GATATGATGA 
CATCAATTTC CAATAGATAA TGTATTCCCA TTGATGGGAC 
TTTCTAAATA TATTGAACTA AACATATACT TCCCCCCTTC 
TTATTTCACA AAGTATTAAT ACGTCGGGTT GTCTAACCTT 
ATCTGTTAAA TCGTTCTTAA CTTACGCCCC TACTACATAA 
ATTTTCAAAA AATTTAGTAT TTATTGCAAA ATTATGTATC 
TATTATCTTA ATTAAGTAGA TTTTTATAAG TTCTAAAAAG 
AGAAGAAACT AACATTTAAA GAAAACATGT TTATAGGTTC 
TTGGTGCCGG CAATCTTATC TTCCCAATAC ACTTGGGTCA 
TTATCGCTAA CTTAGGATTT TTAATTACAG CAATTGGCTT 
CTATTGGCAT TTCAAAGACA TCTGGTTTAT TTGAAATTGC 
ATGCTTACAT TTTCACGATT GCCTTATATC TAGTTATCGG 
GACTGGCAAC GACATCATTT GAAATTGCAT TTTCGCCATT 
CTTTATATTT ATTTATTTTT AGCTTCGTCT TCTTTGTGAT 
AGCCATCAAG AATTTTAGAA TATATCGGTA AATTTTTAAA 
TAGCAATTAT TTTATTATTT GCTTTTATCC ATCCATTAGG 
TTAGTAAACA ATATCAATCA CATGCCTTAT TTAACGGCTT 
TAGATGCGCT AG CGT CATTG GCATTTGGTA TTATCATTGT 
GTATCGAAAA TCCAACTGAT ATCGCTAAAG AAACAATTAA 
TTATGATGGG GATCATTTAT ACCCTACTAG CAATCATGGG 
TCAAACTTAG TGAAAATGGT GGTATTGCCT TAGCGCAAAT 
ACTACGGTAT CGTCCTGTTG TCACTTATCG TTATGGTTGC 
GTTTGATTAC GGCATTTTCA GAAACATTCG AACACCTTTT 
CGATTGCAAC AGTTGTAAGC TTTATTTCGT TCTTATTCGC 
TTATTATGTA CTCAGTCCCA GTGTTAATGT TCTTATATCC 
TACTAACATT ATTTAGT AG C AAATTCCATC ATTCAAAACT 



TTGTGATAGA CAAACGACAT 12540 

GACGTCGAGG AATTGATACG 12600 

CGACAGOGCG AGATGCCTAT 12660 

GTGCACAAAA CGAAAOGCTA 12720 

AAACAATAAC TACAAACGAC 12780 

GATCATGTTG AGGGGGATCT 12840 

CTATATTTAA CATATTCTAT 12900 

AAAACAGTAT TTATTCCGGA 12960 

ACTTTATGTT TAATTTTTGA 13 020 

GAGAACAAAT ACATATATGA 13080 

TATGTTATTT GGTTTATTCT 13140 

AGCTGCTGGT TCTAACGTTT 13200 

ACCATTTCTA GGTATCATTG 13260 

ATCGCGTGTT AATAAAACAT 13320 

ACCATTTTTC GCCTTACCTA 13380 

TTTATCACCA AAGCAAATCA 13440 

TGCATGGTTT TTTGCGAGAA 13500 

TCCGGTATTC TTAGTATTAT 13560 

TGGCATATCT GATGCACCTA 13 620 

TTTAGATGGA TACAATACCT 13 680 

TGCAACGATT AAAAAGTTAG 13740 

GTCTGGTACT ATCAGTATCA 13800 

TACATTAAGT ATTGGTCATT 13860 

TACTCAATAC TACTTAGGTA 13920 

TTGTTTAAAA ACAGCCATCG 13980 

CCCTAAAATG AATTACCTAG 14040 

GAATGTTGGT TTAACTAAGA 14100 

ATTAGCAATT GCCTTGATTG 14160 

TATTTATCAA TGTACCATTT 14220 
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GCACATCATT CTCACAAACT TTGATTAATT TCAGCCAAAA ATATTTACCA TTATCAGACA X4340 

TTGOTATGGG CTGGGTTOTT CTCAOTTTOA TTQGTTTCAT TATCOGCTTC ATTATTTATA 144 00 

AAATTAAGCA TCGTAAAATT CCACAAGCAT AATACTATGC CACAGTCATA TGTTAAACAT 14460 

ATGCTTGTGG CATTTTTTAT TCATACTACA TTAAACTOCA ATCGTATACA TACATATCAA 14520 

TGATTATCCA CAAAAAATAT TAGTACTTTC ATTTTACAAA TCACATTAAT ACAAACACAA 14 580 

CCTTATCTTT ATATTATTAA ATTTATATTT GACACTTATA TTGAACAACT GTAATATATT 14640 

AATATTAATT CTTTAAAATG TATAAATATA AAGGAGGGAG ACCGATGaAT TCAATCATTG 14 700 

aATTAACTGA TTATTATAGC TCTAATAATT ATGCACCACT TAAGCTTGTC ATTTCTAAAG 14760 

GTAAAGGTGT CAAAGTTTGG GATACTGATG GCAAACAATA TATAGATTGC ATTTCGGGTT 14820 

TTTCAGTTGC AAACCAAGGC CATTGTCATC CAACAATTGT TAAAGCGATG ACAGAACAAG 14880 

CTTCAAAGTT GTCTATCATT TCACGTGTCC TTTATAGTGA CAATCTOGGG AAATGGGAAG 14940 

AAAAAATTTG TCATCTTGCT AAGAAAGACA AAGTACTCCC CCTTAACTCT GGTACTGAAG 15000 

CTGTTGAAGC AGCCATTAAA ATTGCTAGAA AATGGGGCTC TGAAGTTAAA GGCATTACTG 15060 

ACGGACAAGT TGAAATCATC GCTATGAATA ACAATTTTCA CGGTCGTACA CTTGGCTCAT 15120 

TATCACTATC TAACCACGAC GCATATAAAG CAGGATTTCA CCCCCTACTT CAAGG CACTA 15180 

CAACAGTAGA TTTTGGAGAC ATTGAACAAT TAACACAAGC TATTTCACCG AATACAGCAG 15240 

CAATTATTTT GGAACCAATT CAAGGTGAAG GTGGCGTTAA TATACCACCG AAAGGATATA 15300 

TTCAAGCTGT GCGTCAACTA TGTGATAAAC ATCAAATATT ATTGATTGCA GATGAAATTC 15360 

AAGTTGGTCT TGGTAGAACT GGGAAATGGT TTGCTATGGa ATGGGAGCAA GTCGTTCCAG 15420 

ACATTTATAT TTTAGGTAAG GCATTGGGTG GCGGCTTATA CCCTGTATCT GCTGTACTTG 15480 

CAAATAATGA TGTCATGCGT GTTCTAACAC CAGGTACACA TGGTTCAACA TTTGGTGGTA 15540 

ACCCTTTAGC CATTGCAATA TCGACGGCAG CGCTTGATGT ACTTAAAGAT GAACAACTGG 15600 

TTGAACGATC AGAACGCTTA GGTTCATTTT TATTAAAAGC GTTGCTACAA CTTAAACATC 15660 

CTAGTATTAA AGAAATTAGA GGTCGTGGTT TATTTATAGG CATAGAGCTT AACACAGATG 15720 

CTGCACCTTT TGTGGATCAA CTGATTCAAC GTGGAATCTT ATGCAAAGAC ACGCATCGTA 15780 

CTATCATTCG ATTGTCTCCA CCTCTAGTCA TTGATAAAGA GGAAATCCAT CAAATTGTTG 15840 

CAGCTTTTCA AGACGTTTTT AAAAATTAAC AATTAATCAT TTATATATGA CATAGGAGGG 15900 

ATTCATGATG ATTAAAGTAG GTATCGTTGG CGGTAgcGGT TATGGCGCAA TTGAATTAAT 15960 

TCGATTGTTA CAAACACATC CTCATGTAAC GATTGCACAC ATCTACTCAC ATTCAAAAGT 16020 
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ACTTACAGTG GaTAATAATG ACTGTGATGT AATTTTCTTT GCGACACCAG CACCCGTAAG 16140 

TAAAACATGT ATCCCTCCCT TAGTAOAAAA AGGTATTCAT GTTATCGATT TATCTGGCGC 16200 

5 

ATTTAGAATT AAGAATCGTG AAATATATGA AGCATATTAC AAAGAAACTG CTGCAGCACA 16260 

AGATGATTTG AATCATGCTA TTTACAGCAT TTCAGAATGG CAATCGTTTG ATAACAATGG 16320 

AACGAAGCTC ATTTCTAATC CTGGCTGTTT CCCTACAGCA ACATTATTAG CATTACATCC 16380 

10 

ACTTATTAGC GAAAAAATAG TAGATTTGTC ATCTATTATT ATTGATGCTA AGACCGGCGT 16440 

GTCAGGTGCT GGTCGTTCAT TATCACAACG gTTcATTTTT CAGAAATGAA TGAAAATCTA 16500 

T5 AGCGCTTATG CAATCGGAAA CCATAAACAC AAACCGGAAA TCGAGCAATA TTTATCTATC 16560 

ATTGCGGGTC AAGATGTATC AGTCATATTT ACACCACATC TCGTACCAAT GACACGAGGT 16620 

ATTTTATCAA CAATATATGT CAAATTATCA TCTGAATATA CGACTGAATC ATTACATAAA 16680 

20 TTAATGACCT CTTATTATGC TAATGAGCCA TTTGTCAGAA TTAGAGATAT TGGGACTTTT 16740 

CCAACCACAA AAGAAGTACT CGGTAGTAAC TACTGCGATA TCGGCATCTA TGTAGATGAA 16800 

ACAACGCAAA CAGCAATTTT AGTATCAGTG ATTGATAACC TTGTCAAAGG CGCAAGTGGG 16860 

25 CAAGCCATTC AAAATTTAAA TATATTATAT GATTTTGAAG TGACGACTGG CCTAAATCAA 16920 

TCACCAGTTT ATCCATAAGG GGTGTTAGAA TGAAACATCA . AGAAACGACA . TCACAACAAT 16980 

ATAACTTTTC AATTATTAAA CATGGCGATA TCAGTACACC TCAAGGCTTC ACGGCTGGTG 17040 

30 

GTATGCACAT CGGTTTACGC GCTAACAAAA AAGACTTTGG GTGGATTTAC TCATCGTCTT 17100 

TGGCAAGTGC AGCTGCOGTA TATACTTTAA ATCAGTTTAA AGCTGCACCA CTTATTGTCA 17160 

CTGAAGACAC TTTACAAAAG TCTAAAGGAA AATTACAAGC ACTTGTTGTT AATTCAGCTA 17220 

35 

ATGCAAATTC TTGTACCGGT CAACAAGGCA TAGATGATGC ACGACAAACA CAAACATGGG 17280 

TTGCTCAACA ACTTCAAATA CCATCTGAGC ATGTTGCTGT TGCTTCAACT GGGGTCATTG 17340 

GTGAATATTT GCCTATGGAT AAAATTAAGA CTGGGACCGA ACATATTAAG GATGCTAATT 17400 

AO 

TTGCAACGCC AGGTGCGTTT AACGAGGCAA TTTTAACAAC TGATACCTGT ACAAAACATA 17460 

TCGCTGTATC ACTAAAAATC GATGGTAAAA CCGTTACAAT TGGTGGTAGC ACCAAAGGTT 17520 

45 CAGGTATGAT TCACCCAAAT ATGGCTACCA TGCTTGCTTT TATAACAACC GATGCATCGA 17580 

TTGAATCGAA TACACTTCAT CAATTATTAA AATCTTCGAC TGACCATACA TTTAATATGA 17640 

TTACTGTTGA TGGCGATACA AGTACAAATG ACATGGTATT AGTCATGGCA AATCACCAAG 17700 

50 TTGAACACCA AATACTTAGT CAAGACCATC CACAATGGGA AACATTTGTT GATGCATTCA 17760 

ATTTTGTCTG TACATTTTTA GCTAAAGCTA TAGCCAGAGA TGGCGAAGGC GCAACAAAGT 17820 
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CTATCGTAAO 


TTCAAATCTA 


GTAAAATCAG 


CTATTTTTGG 


CGAAGATGCC 


AATTTTGGTC 


17940 




GAATCATTAC 


AGCTATTGGC 


TACAGCGGAT 


GTGAAATTGA 


TCCTAACTGC 


ACATATGTTC 


18000 


5 


AACTGAACCA 


AATACCTGTC 


GTTGATAAAG 


GTATGGCTGT 


ACTATTTGAT 


GAGCAAGCTA 


18060 




TGTCGAATAC 


ATTAACTCAT 


GAAAATGTCA 


CAATTGACGT 


TCAGCTTGGT 


TTAGGTAACG 


18120 


10 


CTGCAGCGAC 


TGCATACGGT 


TGTGATTTAT 


CCTATGATTA 


TGTGCGTATC 


AACGCATCAT 


18180 


ATCGAACATA 


AGGTGGTGTT 


GGTTAGATGA AATTTATTGT 


CATTAAAATT 


GGTGGCAGTA 


18240 




CACTTAGTGA 


CATGCATCCA 


TCAATTATTA ACAACATTAA 


GCATTTACGA 


TCAAACAACA 


18300 


15 


TCTACCCCAT 


TATCGTTCAT 


GGCGGTGGCC 


CATTTATTAA 


TGAAGCATTA 


TCAAACCAGC 


18360 


AAATCGAGCC ACACTTTGTT 


AATGGCCTAA 


GAGTGACTGA 


TAAAGCAACC 


ATGACCATTA 


18420 




CTAAACACAC 


GCTCATTGCA 


GACGTTAACA 


CTGCATTAGT 


AGCTCAATTT 


AACCAGCACC 


18480 


20 


AATGTTCTGC 


AATAGGCTTA 


TGTGGTTTGG 


ATGCACAGCT 


GTTTGAAATT 


ACATCTTTTG 


18540 




ATCAACAATA 


TGGATATGTC 


GGTGTTCCGA 


CCGCTTTAAA 


TAAGGATGCT 


TTACAGTATT 


18600 




TATGTACTAA 


ATTTGTACCT 


ATCATCAATT 


CGATTGGTTT 


CAATAACCAT 


GATGGAGAAT 


18660 


25 


TTTACAATAT 


TAATGCTGAC 


ACGCTTGCCT 


ATTTTATTGC 


ATCATCATTA 


AAAGCGCCTA 


18720 




X 1 InlVjinl X 




GCAGGTGTAC 


TCATCAATGA 


TGTTGTTATA 


CCTCAATTGC 


18780 




CATTAGTCGA 


TATTCATCAA 


TATATTGAAC 


ATGGTGATAT 


TTATGGAGGT 


ATGATTC CCA 


18840 


30 


AAGTGCTAGA 


TGCCAAAAAT 


GCGATTGAAA 


ATGGCTGTCC 


TAAAGTTATC 


ATTGCATCAG 


18900 




GAAACAAGCC 


AAATATCATT 


GAATCTATTT 


ACAATAATGA 


TTTTGTTGGC 


ACAACAATCC 


18960 




TTAATTCATA 


ACTATGAAAT 


TAAGGCCTAA 


CAAGTTTTGA 


CACGCGAGAT 


GATTCCAGTT 


19020 


35 


CGATTATCCA 


TTGCGCTAAA 


ACATTTATTT 


ACCGTTCATC 


TCGTTAACAA 


TTTTGAATAC 


19080 




AGTfiCGATAC 


AATATGAGAT 


GTAAAAAACT 


AATAACCTTT 


TACAAATTTG 


TTTATCAAAA 


19140 


40 


TATTTTAAGT 


TTTGCAAAGC 


TTTTTATTGT 


GATTATTTTC 


ACAAAATACT 


ATAATGAGGA 


19200 


TAGTAAATAG 


AGAGGAGTCC 


TTAAGTTGAC 


GAAACGACAA 


ATGGGTATAT 


TCATTTATGC 


19260 




TGGAATTATC 


GGTGGCTTGT 


TATCTGGAAT 


TGTAAAATTA 


GGTTGGGAGG 


TCATGTTTCC 


19320 


45 


ACCTCGCACA 


CCAGAACGTA 


ATGCAACGAA 


CCCACCTCAA 


GAGTTATTGC 


AACAATTAGG 


19380 




ATTTAGTAGT 


GAGTTTACGC 


ATCAAACATA 


TACATTTTCA 


AATATGGAAT 


TGCCTTGGGT 


19440 




AAGCTTTATT 


GTCCACTTTA 


GTTTTTCTAT 


CGTCATTGCA 


ATTATTTACT 


GCATATTAGT 


19500 


60 


TAAAAAATAC 


GCTTACTTAG 


CAATGGGACA 


AGGTGCTGTT 


TTTGGTATTG 


CTATTTGGGT 


19560 




ATTATTCCAC 


CTTATCATTA 


TGCCAATCAT 


GCATACTGTA 


CCTGCTGTGT 


GGGATCAACC 


19620 
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10 



15 



20 



35 



40 



45 



AGTGCGACAA CATTTTGTCT ATCGCTATAA ATTAAATTAA TACACTGACT AACATTAACG 19740 

TGAGTTTtAA ATCATCGTTT GAGTATGATG ATTGATGCTC ACGTTATTTT ATTAACTGAC 19800 

ATGATATGAT TCCAGCCAAC TTACGTGAGC ATTAAAGTCT CAAATGCGTC GTAACAAACT 19860 

ATTATTTTCG GTAATTTCAA TATTGCTCAG TATATTTTTA CCTTATCACT TACTTTAATC 19920 

TCGTCATGAT TTTGAATGAT GCCATCGTGT ATTCACCTTT CATTTTTCCA ATAAAAAAAC 19980 

ATCTAACAGT AAACATTTAG GCAGTATAGT TTAAAATCAC TGCGCAATGA TACTGTCAGA 20040 

CGTCATATTA ACTACTCAAT AACTGAAATA CAGACACTTT TTTATAACCC CAGGGTGCCT 20100 

GTCCTAAGAA ACATACCTGT ACCATAAACT GATCAAAAAT AAATTGTTTG AACTTCACTT 20160 

CACGTGATTG ATAAAAGTGT GATTGTGTCA TATCATAAAT GTCCAATCCT TTGATTAAAC 20220 

CTTCACCAAT CAATTTTGTA AAACTTTCTT TTTGTGTCCA TATTTGATAA AAATCATTTA 20280 

AACTACATAT TTGATGTGCT TCGTTTGTAG AGAAACACGT CACTAACGTA CGCCAGTCTA 20340 

AACGTTGTGA TATCTTTTOG ATATCAATAC CAACTGGTTC TTTATCGACA ACACACACGA 20400 

TATAAGGATA ACTATATGAT AAGCTCACAT AGATGGGCTG TCCATCACGA TTGTGTTGAA 20460 

CAATATCTGC CTTACCTCGT GGCGAAATGT GATAATGCCA TTCATGTGGT AATAAACCTG 20520 

TGTCATGTTG AATTCCATAT TGCACTAAAA TATCTCCCAA TCTGTGCATG AGTTTATCTT 20S80 

GATTGTATCT ATAGTTGACT GTACGCGGTT TTTTATATGA CCAACGACTT TGTGATATTA 20640 

ATTCTTCAAT ACTTTTCAAG TTACTCTGTA ATTGCATTAC AAATACTGTC ATAACTTTCC 20700 

CTACTTACTT ATTGAATATT GTTTTGATAT ATTGTGCCCA ATGATACAGC CAATTGTTAG 20760 

TTATCGTTGG CCATTTTTCA CTGATGTGAT TCATTATTTT TAATGTTAAT GTTGTATCTA 20820 

TCATTGCTAG TTGTTGTTCA CGGTCAACAC TAGTTAATCC AATCGTTTCG TACATGTCTT 20880 

GTTTCTGTAA AATTTCATTA AATGATTCAT CGCTGACGAG TTCAATTTCT TTGCGCTTAA 20940 

CGCATTCTAA CAAAGATTTC ACCGGCATTT TATTAGGTGA TAGCACATGG TAAATGATTT 21000 

GTGGTGTGTT GACCTGTGCT AATGCGACAA TTTGTCTTGC AGTCGTATCC ACAAAAOAAA 21060 

AATCTACAGG CATTTCAGCC ATGCTAACCC CGATACAATC CAGTTGTAAC AAATCATTCA 21120 

TTACCATTGA AAAACGGTTA GTCTTTATAT TTCTCATATG CCATCTTCCA TTGTAAGGAT 21180 

TCGTCAAATT ACCAACACGT ACAATCCGAC CATCTAAGCC ATTATTTACA GCTTCTAATA 21240 

CTTTTAATTC ACTATAAAAT TTGCTCCGTG TATATGGTGA TGTTAGTAGT TGCCCTTTAT 21300 

AGACATCCGC TTsTGAAAAT GTCACATCTT CTGTGTCTAT ATCAAAATAA GTTCCCACAC 21360 

TTATCGTAGA CACATATATT AACCTTGCAT GATGTTGTTG TGCCAAACGT ATGACATCAA 21420 
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CACCTOCATG AATAATCGTA 


i TCCATGTTTT 


' CTGGTAAAAC AACATCATCC 


ATACACTCGA 


2X540 




AATCACCAAC 


' AATGACTTCA 


, ATGTTTGATA 


ACATTATTTC 


! AACCGTCTCT 


TCTGAAAAAT 


21600 


5 


AATCATTTAA ATTCGTCATC 


1 AACTTATACC 


ATGCTATTTC 


CTCATTATCA 


GCACGTATGA 


21660 




AACAATAAAT 


GCGATGACTG 


TATCCTTGTA 


GTACTTCAAT 


CAGATAAGCA 


CCTAAAAAAC 


21720 


10 


CTGTCGCGCC 


AGTCAATAGT 


GTATTTCCTA 


GAGGTCGATG 


ACTTAGACTA 


TCCTCTAAAA 


21780 


TACCCAAGTT 


ATAACGAGAC 


ATAACAATCT 


TTTGTAATTC 


CGAAAGATTA 


TCCGGTAATG 


21840 




CAACTAATGA 


TTGTTGATTT 


TGGTACATAT 


AATTAACAAT 


CTGTCGCACG 


GTTTTATATT 


21900 


IS 


GGTATAATGT 


CTGCATTGAA 


ATATGATGGC 


CAAATCGTTT 


TAAATGCGAG 


ACAACTAACA 


21960 




TCGCCTCTAA 


TGAGTTACCA 


CCAAGTTCAA 


AGAAATCATC 


GTCAACACCG 


ACATCATTTT 


22020 




GTTTCAATAC 


CTCTCCAAAT 


ACATCAACAA 


ATGTCTGCTC 


AATTTCATTA 


GAGGGTTCGC 


22080 


20 


TATACACTTT 


ATTAGACTGT 


TGTATAGGTG 


ATGGATTTGG 


CAAACGCGTA 


GTATCCACCT 


22140 




TGTCATTCGT 


GGTTAATGGC 


ATACAATCGA 


TATGCGTTAT 


AGTCTTAGGA 


ATCATATACT 


22200 




TAGGCAGCTG 


ATCATTTAAA 


TATTGCTTCA 


AATCCTGTTC 


CACTTGTTGC 


TCTCCGACAT 


22260 


25 


AATAAGCATT 


CAATATATCA 


TGCGTATCAA 


AGTGACTTAC 


TGTTACAACA 


CAATCAGATA 


22320 




TACCACGAAT 


AGCTAATATT 


GCATTTTCAA 


TTTCATCAAG 


TTCAATACGG 


TACCCGTTAA 


22380 




CTTTCACTTG 


TTTATCTATT 


CTTCCTAAAA 


ATTCAATTTG 


ACCATCAGAT 


GTATAACGTG 


22440 


30 


CTAAATCACC 


ACTATGATAC 


AACTTTCCTT 


TACCAAATGG 


ATTATTTTGC 


CATTTATCAG 


22500 




CCATTAATTC 


TGGACGATTA 


ATATATCCTA 


TCGCTAAACT 


ATCACCTGCA 


ATACACAACT 


22560 


35 


CGCCTGGCAT 


ACCAATACCG 


CATAACAAAC 


CATCTGACAT 


AATATACACT 


TGGATGTTAG 


22620 


ATAAGGGTTT 


GCCAATTGGA 


ATCGTCTCAG 


GTATCAAATC 


ACCACAATGA 


TGTGACCAAT 


22680 




ACGATGTGAT 


GACTGTTGAC 


TCAGATGGTC 


CAT AGG CATT 


GAAATACGTG 


CCACAATGCT 


22740 


40 


TCTCAATATA 


TTTAACAAAG 


GATGCCGTAC 


TAGTTGCCCC 


GCCTGTAATC 


AACTTTTCAA 


22800 




TATAAAAGTC 


TTCCATAACA 


CTACACATCT 


GTAACGGAAT 


CGACGCAACC 


GTCACACGAT 


22860 




GCTTATTAAT 


GAGTTGTTGT 


AACTGTTCTG 


GATTAACACG 


TTCCTCTCTA 


TCTGGAATCA 


22Q20 


45 


CAAGCGTATG 


ACCATTTAAC 


AAACAACAAT 


AAATCTCCAT 


AACTGATGCA 


TCAAAAACAA 


22980 




TATTTGCATG 


TTGCAAAAAT 


ACTTCATTGT 


CGCCTAATTG 


CAATTCAGTT 


GACCATGCAT 


23040 




GCACTAAATT 


CAACAAATTT 


CGTTGTCGTA 


TGGCAACCCC 


TTTAGGCATC 


CCGGTCGTAC 


23100 


SO 


CAGATGTGTA 


AATAGCATAC 


ATCTCATTAT 


CTAACATCGC 


TGTGTTTTCA AGTTGATTGC 


23160 




CATGTAAATC 


ATCATATTGT 


TCATTTTCCT 


TTGATTCAAC 


AAAGCCTTTA 


GCATTTTCCA 


23220 
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TAGCATCCTC CAAAATTGCA CCTTGTCGTT 
AAGATGCACC TACTTTAACT GTCGCCAACA 
5 TAAACAAGGC AACCCGTTGA CCATTGCCCA 

CATCCACATA GTTOCGTAAT GTTTCATACG 
CATGATTACC TTGTCGTGAG ACAACTTCAT 

10 

GGACATTAAG CATTCGATCG TTAACATGCG 
CGTTTGGTAT ATCACAAATT TGTAGTGTAT 
TCATACATTG ATTACCCATG TGACGAACTG 

IS 

CGATATTGAT TGTATAGTCA TCGCGATCTT 
CCGTCACTGA TTTGGGTTGA ATGTGTGTTA 
TTTCATTGTT TTGTAGTACT AACATGACAT 

20 

ATTOATCTAA GTCATTTACT AAACATTCGA 
AACTCATTTC CTTAACCTCT TGTAAAAACT 

25 CTCTATATAC CAACGTATTA GCAAACATGC 

GCGCACTCAT CACACTACCG ACAACAACAT 
TCATOACCAC ACTCATAAAG AACATAAAAT 

30 GAAGTAGCTG TCTCATTTGT TGATTCATTG 

TAATATTTGG TCTAACATAG TCTGTCGGTA 

GAGATAACCA ATATTGTCTA TGTTTCGTCA 

3S 

CTTTATATTG CAATTTAAGT GGTAACAATA 

TCATTAATTG TAT ATT ACT C ATACCGTCAT 

ATGCATGTAA GGGACTTCTA ATGTATCTCA 

40 

AAGGTGCTAC AAATTGGCGC ATGATTTCTT 
CAAAGTCAAC TGCAACATCT GCCACAATAC 
ATTGTGTTCG TAAAATCTCA TGTCGCGCTA 

45 

CTACATTAAG TTCTGATGAT AACCGCCATA 
GGTTTGATTT CCATAATAAA TACATACGCT 
so TAACTATAGT TTCTGGAATC ACTTCATAGT 

CTAGTTCAAA TACAGTTGGC TTTTGTAATA 

55 



TATTCGGAAA 


ATCAATATCG 


ATAGGTATAT 


23340 


TCGCCGCAAT 


CATTTCAAAA 


CTACGTTCTG 


23400 


CACCATTTGA 


T AGGAG CATG 


TGCGCAATGG 


23460 


TCATTGTCAA 


ATCATTCATG 


ACTAGCGCAA 


23520 


TAAAGTAACT 


TATGATAGAT 


TTATTTCCCG 


23580 


TATTGACCCA 


ATTTAGAAGT 


TCCTCCGTGC 


23640 


CTTGATGCTT 


CAAAATATAA 


TCAATCATAA 


23700 


TTTCTGAGTG 


ATATAAATCG 


GTATTATACT 


23760 


CTTCAATGAT 


GAAAGATAAA 


TCAAATTTCG 


23820 


ATTTACTATG 


CCCAAAATGA 


GCATGATTCG 


23880 


CAAATAATGG 


ATTCCGTGAG 


GCATCATGTG 


23940 


ATGGGTATTC 


TTGATGCTCG 


TATGCCTCCA 


24000 


GTGTCCACAT 


TTTATCAGGT 


GACGGTTGCC 


24060 


CTAGCATTTG 


CTCCGTGCCT 


TTATGCATAC 


, 24120 


CATCTTTTCG 


AGCATATCTA 


CTTAACAACG 


24180 


CAGTAATTTG 


ATGCTTTTCT 


ACATACTTTT 


24240 


TAAATGACAT 


CATTGCTCCA 


TTTGT CGTTT 


24300 


AGCTTAAAAT 


AGGTACTTCA 


TCTTTGAATT 


24360 


TATCACGATG 


CGACATCCAC 


TCACTATAGT 


24420 


ATTTATGTTG 


ATAAAGTGCG 


TTAAGATCAT 


24480 


TAATGATATG 


ATGCGTATCT 


ATAAAGAGGT 


24540 


CTCTAATTTG 


ACTTGGCTTT 


TCCAAATTAA 


24600 


GTTCATCCGT 


AAAATGCGTG 


TTAACTTCTT 


24660 


GTTGTCGAAC 


CTCATCATCT 


ACAACAATAT 


24720 


TCAAACGCTG 


CACTGCTTGT 


CGCAATTGAG 


24780 


AAAAAGGTAC 


GTTATACACC 


GTATCTTTAT 


24840 


TTTGTGCAGA 


GCTCAGCACA 


TAATCATCTT 


24900 


TTTGTTCTTG 


AACCTTAGCA 


ATCGCTTGTG 


24960 


AATCACCAAT 


TTGTAATCGT 


TTCCCAGTAG 


25020 
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AATTATCATG 


AATACCTACT 


TGATTCACAT 


GTAAAATATC 


TGCAAAAATT 


TGGCATAGCA 


25140 




AGTGTTCGGT 


ATCTGTACTC 


GGTGCTACAT 


AGGCATCCGT 


ATCGACATAG 


TCCATGATAG 


25200 


5 


GCAATGCCTT 


CTTATCTAAT 


TTCCCATTAA 


TAQTAATAGG 


AATTTGCTCA 


ATATGCATGA 


25260 




AATTAACTGO 


TATCATOTAC 


TCCGGTAAGG 


TCATACGTAA 


TTGTGATTTA 


ATCTTATTAT 


25320 


10 


GTGATAATGT 


ATGCATCGCT 


TCATAATAAG 


CAACGATATA 


CTGATCTTGA 


TCATGATTTT 


25380 


GAACAATAAC 


AACTGCTTTA 


TTAATACCTT 


GTATACGCTC 


GAGCGCATGC 


TCAACCTCTG 


25440 




ACAACTCAAT 


CCTAAACCCT 


CGAATCTTAA 


CTTGTTTGTC 


CTTTCGATAT 


AAATAATCTA 


25500 


IS 


TGTTGCCATC 


GGGTAACAAA 


CGAACGATAT 


CACCACTTCT 


ATACATCAGC 


TGaTTTATAT 


25560 


TTGAATCTTT 


GATAAATTTA 


TCTGCTGTCA 


ATTCTGGCTG 


ATTTAAATAA 


CCTGCAGCTA 


25620 




ACCCAAAGCC 


ACTTGTACAT 


AATTCTC CAG 


GAATACCAAC 


GCCACACCGA 


CGCTCGCCTT 


25680 


20 


GCATGATATA 


AACATGAGTA 


CCCAGAATCG 


GTTTACCAAT 


AGGAATACGA 


TTTGGAACTT 


25740 




TGTTAGGTAT 


ATTATACGTC 


GTTGTAAATG 


TTGTATTTTC 


AGTTGGTCCA 


TAACCATTAA 


25800 




TAATTTGAGG 


ATGCTTCGGT 


TTTTGATTAA 


GCAAATCCAC 


CCACTTAGCA 


TTCAATACTT 


25860 


25 


CTCCACCAAT 


TAATAAATAC 


TTTAACGGTA 


CCAATACTTC 


TATTCGTTCA 


CTAGCAATCT 


25920 




GATTAAATAA 


TGAGGAGGTT 


AACCACATAG 


TATTAACGTC 


ATTTTCATTG 


ATTAATTGTT 


25980 




CTACCGCTAT 


TGGATTTAAT 


AATTGTTCTT 


TTTTAGCAAC 


AATCAGCTTT 


CCACCATTGA 


26040 


30 


GCAATGCACC 


ATATATTTCA 


AATGTTGCAG 


CATCAAAGGC 


TATAGTTCCT 


GATAACAAAA 


26100 




TCGTCGTCTC 


TTCATTTAAT 


GGTACATAAT 


GATTTTGATG 


GACCAAGCGA 


ACAATACCTC 


26160 




GGTGCGGAAT 


TAGTGTCCCT 


TTAGGGTTAC 


CAGTTGTCCC 


CGACGTGTAA 


ATAACATAAG 


26220 


35 


CATGATCTTC 


TAACGTGTTA 


CATTTAGAAA 


GATTATCAAT 


AriTlTCCAC 


G CTATCTTAT 


26280 




TCAAfiTCAAT 


GTGATTAATA 


TTTTGTTTAC 


CATTTTCATA 


TAAAGCTTGG 


TACGTTATTA 


26340 


40 


CAACTTTAGG 


CGTTACATCT 


TTTAAAATGT 


ACTCCTGACG 


ATCACTTGGA 


TAGTTCGGAT 


26400 


CAATTGGCAC 


GTAAGCCCCA 


CCAGCTTTCA 


ACACACCTAT 


CATCGCTATT 


ATCATCTCAA 


26460 




J> A i. A A Iv 


AGCTATGACA 


GCGACACGAT 


CATTAGGTTC 


AACACCATAC 


TGGTTTCTCA 


26520 


45 


AACGGTGTGC 


TAAATCATTC 


GCGCGTGCAT 


TCAATGTTTG 


ATATGTTATA 


AACACTCCGT 


26580 




CAAATTGCAC 


AGCGACATGA 


TTCGGCGTTG 


CTTCAACTTG 


TTGCTCAAAT 


AAGGTAACAA 


26640 




CTGTTTGCGC 


ATCATCTATC 


TCAGGCAAAC 


TTAAATTGAT 


ATCGTCATAT 


AATTGAATAT 


26700 


SO 


CACGTTCTGT 


CATCAAATTA 


AGTTCATCTA 


CAGTTGTTCG 


TTTATTTCCA 


TTTTCTTCAG 


26760 




TAATTTGCAA 


ATAAATATTT 


CGAACTAAGT 


CACTCAGCGT 


CTCGATTGAG 


AGCAAATCAT 


26820 
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CTAAAGATGT 


ATGTGCATCA 


TGTATTTGAT 


GTACATCCTC 


AATAACATCA 


TTACAACAAG 


26940 




ACATCATATG 


ATGATAACAA 


TGAAAAATAG 


TCTCTAGTGA 


AAGCGAAGAC 


TTCGCGCACT 


27000 




GTAATTGCGA 


CATATTTTGC 


AACACACATT 


TATTAAAATC 


TGTTGTAAAA 


CGTTGACATA 


27060 




CATCTTTTGC 


ATCGATTGTT 


AACGTTAACG 


GCACAATATT 


TCCGTGTAAA 


TCATTTGGTA 


27120 


10 


AATGTGATGQ 


TACATGTATA 


CCTAATGTGA 


CATCATGTTG 


TTGACTCATT 


ATATGATTAG 


27180 




CTAAATACAC 


ACTAACAGCC 


AACGATGCCA 


TATCTATTGA 


TGTCATATCA 


TCAATCAAAT 


27240 




ACGTTTGATA 


TAAAGCTTGT 


TCAAATGGAT 


GCTTAATTGG 


AAAATAACTA 


TCAATATGGA 


27300 


15 


TGTCAGAGTT 


ATTCTCTAAC 


CGAAAATAGT 


TTGAGTCTAA 


TGCTATATGC 


GATGCATCTT 


27360 




GATTGTCTTT 


ATCATCATTT 


CTATTTATAT 


GTGCATGCTG 


TCGAGTATTG 


TTAATAACAG 


27420 




TATTGCCACG 


ATATGCATTG 


CATAAATCAT 


CAAGAAnAAT ATCAATTTGA CTATCATCga 


27480 


20 


AAATGGaCAC 


ATGAAAATCT 


aATAGTATAT 


ATGCAGCATC 


AGCGAACTGm 


AACAATTTAA 


27S40 




CTTTGAATAA 


AGGTGAATCA 


TTAAAATGGT 


AAGTACTTAA 


TTCTTGCTTA 


AAAAAAGCTT 


27600 




CTAAATCATA 


GTTTGCGGAA 


GAAGATGGAA 


CTTGTTTTAT 


CTCAATAAAA 


GGCAGAAATT 


27660 


25 


CATGAAOTAT 


CATTGTTAAA 


TTGTCATCGG 


TAGTAACATC 


AAAAAAATGT 


CTTATAGATG 


27720 




CATGTTGTgC ACAATTGTCG 


ATAATGCATA 


CATCATTTTA 


GTAGCTTCAA 


CATTTTTAGC 


27780 


30 


GAGTTTAACC 


CAATACGCAT 


TACGGTGTGT 


CGTTGATTCT 


GTATTATTTT 


TGTATATACG 


27840 


AAAATATTCC 


TGTTGAAATC 


TCAAATTACC 


CATAATCATA 


AAAAGTCCTT 


CTTTCATATC 


27900 




ATAATACTCA 


TTACTTACTG 


AAATTGCATG 


ATGATATGAT 


AACCGACGAA 


ATGTTAATTA 


27960 


35 


ACTCGTTATG 


TAATGaTTAA 


TATaAAACAC 


CATTCGCAAC 


ATATGAGCGA 


TATATTCTAC 


28020 


CCTAAAATAC 


ATCTTGTATC 


ATCGTTACAA 


TTGGTATATT 


TTTCAATGTA 


AATTACATAC 


28080 




ATCTTCGATA 


AATAGCACAC 


TACAAATCGT 


TAATCACTTT 


CTGTTGTTCA 


CATCTCATTG 


28140 


40 


CAAACTCAAT 


ATTGTTGTTA 


CAAAATATCC 


ATGAAGCAAG 


TTTATATTAA 


ACAAACAACT 


28200 




CGCATAAAAC 


AATTGTTATC 


CTTAAATTTT 


AACAAATTCT 


TAATAAATTT 


ATCTCTATTT 


28260 




TAATTACGAC 


CAAATTAATA 


GGTTTTCCAT 


ATAAAAAGAT 


GCATAAAATA 


AATATTTAAA 


28320 


45 


TAAATTCAAT 


TTGTATTCAC 


TTGTTTTTGT 


CCCCCAAATA 


CACCAGCAAC 


AAGCATGCTA 


28380 




GCACCAATTG 


TTAAAACGAT 


AAACATATAC 


AGTCCCATTT 


GTAATGACGT 


TAAGAAAACA 


28440 




CCCAACACAA 


TCCCTAACCT 


AGCTAGTGTT 


TCTGAAAAAT 


GAATACCTAA 


TGCATTAACT 


28500 


SO 


GCACTATATG 


TTCCTCTTTT 


AGCTTTAGGA 


ATAATTTTAA 


AGCGTTGTTC 


TGAAACTATA 


28S60 




GGCGAATAAA 


TAATTTCACC 


TACAGTCGCA 


ATTATCATAA 


AAAGAACTAA 


TAAGC CAAAC 


28620 
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is 



20 



25 



GCTTTTTTAA 


AATCTATTTT 


CAATACAACT 


TTCGAGATTG 


AATACGTGAG 


TAaAATGACG 


28740 


ACGACCGTAT 


TAATCATTAG 


CAAGATTGCT 


AACATCTTAG 


CACCTGTAAT 


ATCATATGAA 


28B00 


CCTATACTTA 


TTGTTTCAAA 


CTGATCCTTT 


AGTCTAATAG 


CAATATATGA 


GGAGATTGAA 


28860 


AATTCACCCA 


TCATGATGAT 


ACTGAACCCC 


GAAATCAATA 


ACATATAATT 


ACGGTCTTTC 


28920 


AAAACTAATT 


TATAACTGCG 


AAATATATTC 


ATTATTTGTA 


ATTTTTGATA 


ACGACTTGCA 


28980 


TGCCTCTTGT 


CATCACTTTG 


CTTTACTTGA 


TTTCGGTCTT 


GAGGTAACCA 


AATATATAAA 


29040 


ATAAAGAGTA 


CAATTAAAAA 


TATACAAGCT 


GCTATTAAGA 


AAAGTAGTAA 


CATACTGTAG 


29100 


CCATACATCA 


AGCCACCTAA 


CAATGCCCCA 


ATAGCTACCG 


ATAAGTTTGT 


CATCCAATAG 


29160 


CTAATCTTGT 


AAATATAATG 


TTCCACGTCT 


TCGGTAATTG 


CATCCATAAT 


TAATGTGTCC 


29220 


ATAACTGQAA 


ATTQTAATt- L. 


CUVAAuiAX 1 








29280 


ATAATTTGCC 


ACAATTGATG 


TGACCCAAAT 


ACGCCCATGA 


ACACAAGCAT 


TATCACCATC 


29340 


GTCGCTTGAT 


AAATAAGTAC 


TAGCAACTTT 


tTCGOAAATA 


TCTCAATAAG 


GTAACCAGAT 


29400 


ATAATOGACA 


ATGGAAATTT 


nAGAACCACT 


AAACCAACAA 


GATATATACC 


GACAATTGAT 


29460 


TGACTTAACA 


TATCTGTTAA 


ATATAGTGCT 


ATAAACGGTA 


TAAATGCTGT 


CGTAATAATT 


29520 


AGCTGTAAAA 


nATTGCTAAT 


CAATCGTACT 


TTCAA 






29555 



(2) INFORMATION FOR SEQ ID NO: 207; 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1539 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

T (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 207: 



40 



45 



50 



AAAAAAAAAA 


AAAAAnGGTG 


AATCTTTAAT 


TAAACACTAA 


TATTGTAAAA 


GATGTTAAGT 


60 


AAACGCTTAA 


TGACACTTAT 


TTTTTGAAAA 


TAATAGTAAT 


ATCATTTTG T 


TAAATGAAAG 


120 


AATAAAGCTA 


TAATtnATTAT 


AGAATAACTA 


TTTAAAGGAG 


ATTATAAACA 


TGCCAATTAT 


180 


TACAGATGTT 


TACGCTCGCG 


AAGTCTTAGA 


CTCTCGTGGT 


AACCCAACTG 


TTGAAGTAGA 


240 


AGTATTAACT 


GAAAGTGGCG 


CATTTGGTCG 


TGCATTAGTA 


CCATCAGGTG 


CTTCAACTGG 


300 


TGAACACGAA 


GCTGTTGAAT 


TACGTGATGG 


AGACAAATCA 


CGTTATTTAG 


GTAAAGGTGT 


360 


T ACT AAAG CA 


GTTGAAAACG 


TTAATGAAAT 


CATCGCACCA 


GAAATTATTG 


AAGGTGAATT 


420 


TTCAGTATTA 


GATCAAGTAT 


CTATTGATAA 


AATGATGATC 


GCATTAGACG 


GTACTCCAAA 


480 
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AGCTGACTTA TTAGGTCAAC CACTTTACAA ATATTTAOGT GGATTTAATG OTAAGCAGTT 600 

ACCAGTACCA ATGATGAACA TCGTTAATOG TGGTTCTCAC TCAGATGCTC CAATTOCATT 660 

5 CCAAGAATTC ATGATTTTAC CTGTAGGTGC TACAACGTTC AAAGAATCAT TACGTTGGGG 720 

TACTGAAATT TTCCACAACT TAAAATCAAT TTTAAGCAAA CGTGOTTTAG AAACTGCAGT 780 

AGGTGACGAA GGTGGTTTCG CTCCTAAATT TGAAGGTACT GAAGATGCTG TTGAAACAAT 840 

10 TATCCAAGCA ATCGAAGCAG CTGGTTACAA ACCAGGTGAA GAAGTATTCT TAGGATTTGA 900 

CTGTGCATCA TCAGAATTCT ATGAAAATGG TGTATATGAC TACAGTAAGT TCGAAGGCGA 960 

ACACGGTGCA AAACGTACAG CTGCAGAACA AGTTGACTAC TTAGAACAAT TAGTAGACAA 1020 

15 

ATATCCTATC ATTACAATTG AAGACGGTAT GGACGAAAAC GACTGGGATG GTTGGAAACA 1080 

ACTTACAGAA CGTATCGGTG ACCGTGTACA ATTAGTAGGT GACGATTTAT TCGTAACAAA 1140 

CACTGAAATT TTAGCAAAAG GTATTGAAAA CGGAATTGGT AACTCAATCT TAATTAAAGT 1200 

SO 

TAACCAAATC GGTACATTAA CTGAAACATT TGATGCAATC GAAATGGCTC AAAAAGCTGG 1260 

TTACACAGCA GTAGTTTCTC ACCGTTCAGg aAACAGAAGA TACAACAATT GCTGATATTG 1320 

2S CTGTTGCTAC AAACGCTGGT CAAATTAAAA CTGGTTCATT ATCACGTACT GACCgTATTG 1380 

CTAAATACAA TCAATTATTA CGTATCGAgA TGAATTATTT GAAACTGCTA AATATGACGG 1440 

TATCAAATCA TTCTATAACT TAGATAAATA ATTTTCTnTA TAATCAAATG CTGACATAAT 1500 

30 TTTAGTTGAG GATTATTATG ACGGTATAAA TAAATAAAG 1539 

(2) INFORMATION FOR SEQ ID NO: 208: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 846 base pairs 
35 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 208: 



45 



50 



CAATTTCTAT 


CTATCAATGA 


TGTGCATACT 


TCCAnTTAAA 


TTAAt CGAAA 


TGaATCAAGG 


60 


TATATCATTC 


CTGCCTCTTT 


ATATAACaAC 


AAATAGTGAT 


TACAATATTT 


CGGTTATTAA 


120 


CACGAAAATT 


TTACAAGCAC 


CTATTTCATT 


TACATATATA 


TACAGCAAAA 


AAGAAAGCCC 


180 


AGAAATATTG 


GTGTTTATTA 


AATCATTTAA 


AAAGTATATT 


GCCAATGAAC 


AATTATAATA 


240 


AATTTCAAAT 


CTAAAAAACC 


AAGAATGCGA 


TTAATCATCA 


CATTCTTGGT 


TCAATTTTAT 


300 


TCATGAATTT 


TTTCAACATT 


AAACGTTAAG 


TTATTGTCTG 


AATTTAAATT 


AACTTTAATC 


360 
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CGTTGTACAA AACGTTTTAA TGGTCTTGCA CCGTATTGAG GTTCATAAOC TTCTTGACCT 4 80 

AGCCAAGCTT TAGCATCATC AGAAACTTCA ATTGAGATTC GTTGTTCTAA TAATCTTATA 540 

5 TTTAATTGOG TTAAGATTTT ATCTACAATC ATACTCATGT CATCAATAGA TAATGGTTTA 600 

AATAATACGA TAT CATC CAT ACGATTCAAA ATTTCTGGTT TGAAATATGC ATTTAAACTT 660 

GTCATAACAG CTTTTTCTGT TGATTCTGTA ATTTCACCAG TCTCTTTTAC GTTTTCTAAT 720 

10 AAAACTTGAG ATCCAATATT ACTTGTCATA ATAATAATAG TATTTTTAAA ATCAACGCTA 780 

CGTCCTTTAG AATCAGTTAA ACGGCtTCAT CTAAAATTTG CAATAATACA TTAAAGACGT 84 0 

CAGTAT 846 



1S 

(2) INFORMATION FOR SEQ ID NO: 209: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1674 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 209: 



40 



45 



SO 



nTGGGAACAG 


TAAGCCAGTA 


TTTTTAGAAA 


GTTGCCATAC 


ATGAGCGTCG 


ATTTTTCCAA 


60 


TATGGCTATG 


ACACTAGAAC 


AATGGGAATT 


TGOAGGAAAA 


GTAAATGATT 


AAACCTAAAA 


120 


TAGCATTAAC 


CATTGCAGGT 


ACTGATC CaA 


CAGGTGGTGC 


CGGCGTAATG 


GCTGATTTAA 


180 


AATCATTTCA 


TTCATGTGGT 


GTATATGGTA 


TGGGCGTCGT 


TACAAGTmTT 


GTTGCTCAAA 


240 


ATACATTGGG 


CGTACAACAT 


ATT CAT AATT 


TAAATCATCA 


ATGGGTAGAT 


GAACAACTTG 


300 


ATAGTGTCTT 


CAATGATACC 


TTACCTCATG 


CTATTAAAAC 


GGGGATGATT 


GCTACAGCAG 


360 


ATACTATGGA 


AACGATTCGT 


CATTATTTAA 


TGCAACATGA 


ATCTATTCCA 


TATGTAATtG 


420 


ATCCTCTTAT 


GTTGGCGAAA 


rCggTGATTC 


ATaATGGwTA 


ATGACaCAAg 


CaAAACTTGC 


480 


AGCATaCGTT 


ATTGCCATTA 


GCTGACGTAG 


TAACACCGAA 


TTTACCAGAA 


GCTGAAGAAA 


540 


TAACGGGACT 


AACCATTGAT 


AGTGAAGAAA 


AAATTATGCA 


GGCTGGCCGC 


ATCTTTATTA 


600 


ATGAGATTGG 


TAGTAAAGGT 


GTCATCATTA 


AAGGCGGTCA 


TTCAAATGAT 


ACTGATATAG 


660 


CAAAAGATTA 


TTTATTTACT 


AACGAAGGTG 


TTCAAACATT 


TGAAAATGAA 


CGATTTAAAA 


720 


CAAnACATAC 


GCATGGAACA 


GGGTGTACAT 


TTTCAGCAGT 


TATAACGGCA 


GAACTTGCAA 


780 


AAGGTAGACC 


ATTATTTGAG 


GCTGTACACA 


AGGCTAAAAA 


GTTTATTTCA 


ATGAGTATAC 


840 


AATATACGCC 


TGAAATCGGC 


CGTGGTAGAG 


GTCCAGTQAA 


TCATTTTGCA 


TATTTAAAGA 


900 
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TGTTATACAA ACGATGTAGT TAAAAATTTT ACAGOGAATG GTTTATTAAG TATTGGTGCT 1020 
AGCCCTGCAA TGAGTGAAGC TCCCGAAGAA GCTGAAGAAT TTTACAAAGT TGCACAAGCG 1080 
5 CTATTAATCA ATATCGGTAC TTTAACAGCA GAAAATGAAC AAGATATTAT TGCGATTGCT 1140 

CAAACGGCAA ATGAGGCAGG CTTACCTATT GTATTTGACC CTGTAGCTGT TGGTGCTTCT 1200 
ACATATCGAA AGCAATTTTG TAAATTATTA TTGAAATCAG CGAAAGTATC AGTAATTAAA 1260 

10 

GGCAATGCAT CTGAAATATT AGCGTTGATT GATGATACAG CAACTATGAA AGGTACAGAT 1320 
AGTGATGCTA ATCTTGATGC GGTTGCAATA GCGAAAAAGG tTACGCAACA TATAAAACTG 1380 

15 CAATAGTAAT CACAGGTAAA GAGGACGTTA TTGtTCmAGA TAATAAAGCC TTCGTATTAG 1440 

CTAATGGATC TCCATTATTA GCACGAGTAA CTGGAGCTGG TTGTTTATTA GGAGGCGTTA IS 00 

TTGCTGGATT TTTATTTAGA GAAACAGAAC CAGACATAGA AGCGTTAATT GAAGCGGTAA 1560 

20 GCgkATTTAA TATTGCTGCT GAGGTAGCTG CTGAAAATGA AAATTGTGGT GGTCCTGGTA 1620 

OGTTTTCACC ATTGTTGCTT GATACGTTAT ATCATTTAAA TGAAACAACC TATC 1674 
(2) INFORMATION FOR SEQ ID NO: 210: 

25 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2232 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
-„ <D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 210: 



35 


ATGAGTTGCC 


GATGAATTTA 


GCACCACCAA 


CGATTGCnTT 


TGATACTGTG 


TCCCAACCAG 


60 




CTTGTTTAGC 


ATATTTAATA 


CCTTCACGTA 


AAGGATCGTT 


ATCATATGCA 


GCAATACCAA 


120 


40 


ATACGTTATG 


GTATTTCGTG 


TTTGAGTTAG 


TTACAACTTT 


GTnTTGCACT 


ACATCTGCAC 


180 


CTTTCGCTAA 


TTGAGAAGTA 


CCGTTACCTG 


TTTCTAATAG 


GGCATGTGAG 


ATAAGATAAA 


240 




CTTCATTAAT 


GCCATACATT 


TGAGCAGCTT 


TGTTAAATGC 


AGCACCTTGG 


TTTTCTAATA 


300 


45 


CACCTTTACC 


TTTTAAGAAT 


TGATTAATTT 


TATCAATAGA 


AATATTTTGT 


GGTTGGTCTA 


360 




AGCGTAAGAA 


TTGATATTTT 


AATGCTGGAT 


CTTGAGCTAA 


ACGCTTCGTA 


TCCATTGCAT 


420 




GCTTAACATC 


ATTAAATTTA 


GCATCTGTCC 


ACTTACCTGG 


TACACGTTGT 


ACTTGTGGTT 


480 


SO 


TATATTGTAA 


ACCAGCTTGT 


ATTTGAGCAA 


CTTGGTTTAA 


TGTCATACCT 


GTTTGATTAT 


54 0 




ACTTAATTAA 


TTCTTTAGCT 


AAATCAGTTG 


ATTTAATCCA 


TGCtAATTTA 


CCGTTAGATA 


600 




ATTT AC CAT A 


GTACCAAGTT 


TGTCCATTAA 


TGACTTGTTC 


TTTAACAACT 


GCGAATGGTT 


660 
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AACCATTACC 


ATTTTTAATT 


ACATAAGTGT 


AGTTATAATC 


TTTGGcAGCT 


GATGTAGTTG 


780 


ft 


GTTTCACAGC 


AGTTGGTGCA 


GTTAAATCTT 


TTGCATTTAC 


CCAACCAGTG 


CGGTTATTAA 


840 


o 


TAGTACCGTA 


TAAATAAACA 


TCTTTGCCTA 


CAGATACTTG 


TTTCGTTGCA 


TTAAATGTAC 


900 




CTTGAGCAAT 


GTTATTGCCT 


GTTAAAATGA 


CTTGGTTTTT 


AGTACCCCAA 


GGAACCATTG 


960 


10 


ATAAGCCGTT 


ATTTGATTTA 


TTAACAGTAT 


ATTTTTGAGT 


CGTTTTAACT 


TCTTTGCCTA 


1020 




AGTTTTGAAC 


ATTTAAGTCT 


TTTACATTGA 


ACCAACCTAA 


TGGGATGTTA 


TGGCTTGTAT 


1080 




TGTTTAATAA 


TACATACGTT 


TCATTACCAT 


GAGCACGCTC 


TTTTGTTACA 


TAGAACGTAC 


1140 


1S 


GGTCTGCATA 


TTTCGCACCG 


TTTTTCGCTG 


TTTTTTCATA 


AACAGAAGCA 


CGAATACCAG 


1200 




TGTTGTTTGG 


TTTAACTTGA 


GCAATCTTGC 


TAACTGTTTG 


AGTCGTTTGT 


GGTTTAGTAA 


1260 


20 


CAGTATAAGC 


TTTTACAGCT 


GTTTTTGGTT 


GTGCTACTGC 


TTTTTTAGGT 


GCAGCAGGTA 


1320 


CAGCTAAATA 


TGCTTTACTT 


ACCCAACCAG 


ATTTACCATT 


TACAGTTCCA 


AATAAATAGA 


1380 




TAGATTTATC 


AATTTGTTGT 


TGCTTAGTCG 


CTTTAAAAGT 


TTGGTTACCT 


GTACCAGAAA 


1440 


25 


CTGCACCAGC 


TTCTTGTTTA 


TAAGTGCCCC 


AAGGTACTGA ATATAATTTA GTGCCTGGgT 


1500 




TTACTGTATA 


TGTTTGCATT 


ACATTTACAG 


GTGATTTTGC 


ATtGtTATAA 


ATACGTCACC 


1560 




TTGTTTAACC 


CAACCAATTA 


AAGTTGGACT 


ATTGTAATCT 


TTAACTAAGT 


AGAATTTGTT 


1620 


30 


TCCACCTAAA 


CTTGCTTCTT 


TTGTTACAGC 


AAATGTTTTT 


TGAACTTCTT 


TCGTTGGCTT 


1680 




ACCAGTTTTG 


TCATAAACTG 


TAGTGAATAA 


GC CATTGTTT 


TTAGCATTAA 


TTTGAGCAAC 


1740 


35 


ACCGTTTAAT 


GATGAAACTG 


TTAATTTATT 


ATTTGTTGTA 


GGTGTTGATG 


GCTTAGGTGT 


1800 


TGGTGTAGGC 


GTAGGTTTAG 


CAGTATCAAC 


TAAATATGCT 


TTACTTACCC 


AACCAGATTT 


1860 




ACCATTCACA 


GAGCCATATA 


AATAAATTGA 


TTTATCAATT 


TGTTGTTGCT 


TTGAAGCCTT 


1920 


40 


AAATGTTTGG 


TTTCCAGAGC 


CAGACACACT 


ACCAGCAACT 


TGTTTAGATG 


TACCCCAAGG 


1980 




TACTGTATAA 


AGTTTCGTAC 


CAGGTTTGAT 


TGAATATGAT 


TGATTTACAT 


TTACAGGTGA 


2040 




TTTAGCTGTG 


TTGTAAACCA 


CATCGCCTTC 


TTTAACCCAA 


CCAAATTTAT 


TACCAGAATT 


2100 


45 


GTAATCTTGA 


ACAAGATAGA 


ATTTTTGATT 


ACCTAATGTA 


GCTGTTTTAG 


ATACAGCAAA 


.2160 




TGTTTTTTGA 


ACTTCATTAG 


TTGCTTTACC 


AGTTTTGTCG 


TATACAGTAG 


TATATAAACC 


2220 




ACTATTTGTT 


GG 










2232 



so 

(2) INFORMATION FOR SEQ ID NO: 211: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2082 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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20 



25 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 211: 

GATTTAAATA AAATTAATGG ATATCGTGAT CGTACGATGT TAGAACTTCT GTACGCAACG 60 

5 

GGAATGCGTG TATCTGAATT GATACATTTA GAGTTAGAAA ACGTGAACTT AATAATGGGA 120 

TTTGTACGCG TATTTGGTAA AGGCGATAAA GAAAGAATTG TACCATTAGG CGACGCAGTC 180 

10 ATTGAGTACT TAACTACTTA TATTGAAACG ATTAGACCGC AACTTTTAAA AAAGACTGTT 240 

ACTGAAGTCT TATTTTTAAA TATGCATGGT AAACCTTTAT CACGACAAGC AATATGGAAA 300 

ATGATTAAAC AAAATGGTGT AAAGGCAAAC ATTAAAAAGA CGTTAACGCC ACATACGTTA 360 

15 CGCCACTCTT TTGCGACACA TTTATTGGAA AATGGCGCAG ATTTAAGAGC AGTGCAAGAG 420 

ATGTtAGGtC ACTCTGaCmT ATCTACTACC CmaCTCTATA CmCATGTTTC GrAATCTCAA 480 

ATTAGAAAAA TGTATAACCA ATTTCATCCT AGAGCATAAA GTGAACAATA ACTCAAAAGT 54 0 

CACAATACAC ATGACTAAAA ATGTCTGTGC TATTGTGGCT TTTTTAAATT GGTTGATTAA 600 

TTACGTCTAT GTTTTCTTAA TTGAATCGCT TCTTCTTTTG CTGCAATCAC TTCTGAACGA 660 

TCACGGCGCA TGTGATGGTC TACAATAAAA GGATCTGTTG CTGTTTCCTG ATTATAATCA 720 

TAGTCTGGAT AGTTGGCCTT GATGATGCGT TCAAAGACTG GAGTTATTGG TAATATAACA 780 

GATGAAAAAG GCTTTGCTGC ATTCAATTTT GCAATCTGTT GCTCAATTAA CAACTGATAA 840 

30 TCATTTAAAT TAAGGTATAA CGCATCTCTA TCTTTAGCAT TTTGTATTAT TTCTTTAGAT 900 

TTATTAAAAG ACTTATAGGC GCCTTTTAAA TTATTGCGGC GATAATGGTA ACAAGCAGTT 960 

GCAAACAAGA TTAAACTAAC AACTGCATCT TGCTTACTGT AGTTATTTTC AGCTTTCCAT 1020 

35 

GCATCTTCTA AAATGTCATG ACATAGGAAA TAATGTTGCT TAGTATGAAA TTGATAATAG 10B0 

AAATTTATCA GTGCCTGTTG CATTTTGTTA TCACCCCAAT TTAAAAGTAA GTTATTTTCA 1140 

TGCTATAATA TTTTAGAGAA TTATGCACAT ATGACGCAAT ACGAGGTAGA TATTATGTAT 1200 

40 

GAAGTTAAAT TAGATGCTTT CAATGGACCA TTAGATTTAT TGCTGCATCT TATCCAAAAA 1260 

TTTGAAATAG ATATTTATGA TATTCCTATG CAAGCATTAA CAGAGCAGTA TATGCAGTAC 1320 

45 GTTCATGCAA TGAAACAGCT TGAAATTAAT ATTGCAAGTG AATACCTAGT ATTAGCGTCA 13 80 

GAACTCTTAA TGATTAAAAG TAAGATGCTA TTACCACAAT CAACATCAGA TATGGATGTT 1440 

GATGATGACC CACGGGAAGA TTTAGT t GGG CGTTTAATAG rATATCaAAA TTATArAGAA 1500 

TATACTG C t A TTTTAAATGA CATGAAAGAA GAAAGAGATT TTTATTTTAC CAAAAAGACC 1560 

GACAGATTTA TCtCATTTGG AAAcAGATGA ATCyTGGGAT CCaAATCATA CGATTGATTT 1620 



SO 
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ATCTGTTGAA ATCCGAAAAG AOACATTTAC CATTCAACAA GCTACAGAAC AAGTQACATC 1740 

GAGATTGAAA GATAAAGATC ATTTTAACTT CTTTAQTCTG TTTACGTTTT CTGAGCCAAT 1800 

S 

TGAACAAGTA GTCACTCACT TTTTAGCTAT TTTAGAGATG TCAAAAGCAG GAATAATTAA I860 

TATTGAGCAA CAACGTAATT TTGAAGATAT TAACATTATT AGAGGAGTGA ACTACCATTT 1920 

w TGGATAATCA TGGTATATTA GAGTCGCTTT TATTTACAGC TGGCGATGAA GGTTTAGATG 1980 

AAAAACAACT ATTAGAAATA TTAGATATGT CGAAAGACCA ACTCGTTGAA TTAATTGAAA 204 0 

ATTATTCATC ACATGGATTA ATGATACAAC GATTTGGAAT GA 2082 

is (2) INFORMATION FOR SEQ ID NO: 212: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4219 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 212: 

25 

TCTATTCTCG TTCTTCCAAG ACCCTGaATT AGAAGTTAAG AAAATCGAAG AAGATGAGAA 60 

AGAATCTATT AAAAAAGCTC AAAAAGGTAT TTATAAAGAC CCTAGAGACA TCAATGATGA 120 

30 CGAACAAGAT GATGATACAA AAGATACTGT TGATAAAAAG GAATGATTGT AATTGCCTAA 180 

CAAAAACACT CAAGAATATT GGGAAGAACG CGGACGCAAA GCAATCGAGA ATGAGTTGAA 240 

GCGTGATAAA ACTAAAGCTG AAGAAATAGA ACGTATATTG AATATGATGA TTAAGCG CAT 300 

35 TGAAAAAGAG ATCaATGCGT TTATTGTCAA GTACGGAGAT TTTGCAGGCG TTACATTACA 360 

AGAAGCACAA AAGATTATTG ATGAGTTCGA TGTAAAAGCG TTTCAAGAAG AAGCAAAAAG 420 

ATTGGJCGAA AACAAGGAGT TT AG CG AT AG AGCAAATGAA GAATTAAAGA AGTATAACAC 4 80 

40 

GAAAATGTAT GTATCTAGAG AACAGATGTT AAAGATTCAA ATAGAATTCT TAATTGCTTA 54 0 

TGCAACAGCT CAAACAGAAT TATCGATGAG GGAATATTTC GAATCAACAG CTTATCGTGT 600 

4S GTTCAGTGAT CAAGCGGGTA TTTTAGGTGA AGGTGTACAA GTAGCTAAAG AAGTTATAGA 660 

TACAATCGTT GATACACAAT TTCATGGTGT CGTTTGGTCA GAGCGATTAT GGACTAATAC 720 

CGAAGCAATG AAACAAGAAG TAGAAGAAAT AATTGCTAAT GTAGTTATTA GAGGTCGACA 780 

60 TCCTAATGAA TATGTTAAAG ATATGCGCAA CACTTAAATA AATTCGAAGG CACAGCACGA 840 

CAAAAGACCG CAGCAATTAA ATCATTGCTT TATACGGAAT CGGCACGTGT TCACGCACAA 900 

TCAAGCATTG ACAG CATGAA AGAAATTTCA CCGGAAGgAT ATTATATGTA TATTGCAAAA 960 

£5 
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10 



is 



20 



25 



30 



35 



40 



45 



SO 



GACGCTAAAA TTGOTGTTAA TTTCTATCCT ATGCATATCA ATTGTCGTTC AGATTGCGCT 
TTACTACCTA AATCTATOTO GCCGAAAAAA CCAAGCAAGA AACGAAAAAC AAAATACTTC 
GGAGGGAAAG TGAAAAGOGG TGATTGATTT AAAAGTGAAG TTTTTTAAAG GCAAGTTAGT 
TTTGTATGAC AGTAAATTAA ATGTTTGGAG GATACTAATA TGAGTAATAC TGACAAATAC 
CTTAGAGACA TAGCAAGAGA ATTAAAAGGT ATACGTAAAG AGTTACAAAA GCGAAACGAA 
ACAGTTATTA TTGATGCAAA CTTAGACAGT TTAAGGTCGG CAGTATTAGC CGATAAAGAA 
AAATCGAAAT ATAATGAACC TCTCTTTTAA TAGCTAGCAC TTAATTGTGT TGGCTATTTT 
TTATGTCCAA AACGTGCTGA TGACATAAAA AGCACGCATG GAAAAACAGT CGACAGACTA 
TAAATGGAGG TATATCTCAT GGAAGAAAAT AAACTTAAGT TTAATTTGCA aTTTTTTGCA 
GAC CAATCAG ATGATCCGGA CGAACCAGGC GGAGATGGTA AAAAAGGAAA TCCTGATAAG 
AAAGAAAATG AOGAAGGTAC TGAAATAACT TTCACGCCAG AGCAACAAAA GAAAGTTGAT 
GAAATACTTG AACGTOGTGT AGCCCACGAA AAGAAAAAAG CTGATGAGTA TGCAAAAGAA 
AAAGCAGCAG AAGCTGCTAA AGAAGCTGCT AAATTAGCGA AAATGAACAA GGATCAAAAA 
GATGAATATG AACGCGAACA AATGGAAAAA GAACTGGAAC AATTACGTTC AGAAAAACAA 
TTAAACGAAA TGCGTTCAGA AGCACGAAAA ATGTTGAGTG AAGCGGaAGT TGATTCATCA 
GATGrGGTTG TCAATTTAGT TGTAACAGAT ACTGCTGAAC AAACTAAATT GAATGTTGAA 
GCTTTTTCTA ATGCAGTAAA AAAAGCGGTT AATGAAGCGG TTAAGGTTAA CGCTAGACAA 
TCGCCATTGA CTGGTGGAGA TTCATTTAAT CACTCGACTA ■ AAAATAAACC ? GCAAAACTTA 
GCTGAAATAG CTAGACAAAA AaGAATTATT AAAAATTAAC GGAGGCATTT AAATGGAACA 
AACACAAAAA TTAAAATTAA ATTTGCAACA TTTTGCAAGT AACAATGTTA AACCACAAGT 
ATTTAACCCT GACAATGTAA TGATGCATGA AAAGAAAGAT GGCACGTTGT TAAACGACTT 
TACAACACCT ATCTTACAAG AGGTTATGGA AAACTCTAAA ATCATGCAAT TAGGTAAGTA 
CGAACCAATG GAAGGTACTG AGAAGAAGTT TACTTTTTGG GCTGATAAAC CAGGTGCTTA 
CTGGGTAGGT GAAGGTCAAA AAATCGAAAC GTCTAAGGCT ACTTGGGTTA ATGCTACAAT 
GAGAGCGTTT AAATTAGGGG TTATCTTACC AGTAACAAAA GAATTCTTGA ATTACACTTA 
TTCACAATTC TTTGAAGAAA TGAAACCTAT GATTGCTGAA GCTTTCTATA AAAAGTTTGA 
CGAGGCAGGT ATTTTGAATC AAGGTAACAA TCCGTTCGGT AAATCAATTG CACAATCAAT 
TGAAAAAACT AATAAGGTTA TTAAAGGTGA CTTCACACAA GATAACATTA TTGATTTAGA 
GGCATTGCTT GAAGATGACG AATTAGAAGC AAATGCATTT ATCTCAAAAA CACAAAACAG 



1060 

1140 

1200 

1260 

1320 

1380 

1440. 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 
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TGATTCGTTA 


GACGGTCTAC 


CTGTGGTTAA 


CCTTAAATCA 


AGCAACTTAA 


AACGTGGTGA 


2880 


ATTAATCACT 


GGTGACTTCG 


ACAAATTGAT 


TTATGGTATC 


CCTCAATTAA 


TCGAATACAA 


2940 


AATCGATGAA ACTGCACAAT 


TATCTACAGT 


TAAAAACGAA 


GATGGCACAC 


CTGTAAACTT 


3000 


GTTTGAACAA 


GACATGGTGG 


CATTACGTGC 


AACTATGCAT 


GTAGCATTGC 


ATATTGCTGA 


3060 


TGATAAAGCG 


TTTGCTAAGT 


TAGTTCCTGC 


TGACAAAAGA 


ACAGATTCAG 


TTCCAGGAGA 


3120 


AGTTTAATAA 


ATAATTAGGA 


GTGGTAACAT 


GCCCGAAATC 


ATTGGAATTG 


TTAAAGTAGA 


3180 


TTTTACAGAT 


TTAGAAGATA 


ACAGACATGT 


CTATATGAAA 


GGGCATGTCT 


ACCCTCGTAA 


3240 


AGGTTATAAT 


CCTACAGATG 


AACGTATCAA 


AGCTTTAGCT 


AGTGTTGAAA 


ATAAACGCAA 


3300 


CAAACAAATG 


ATTTACATTG 


TAAATGACAA 


ATTAACCAAA 


AAAGAACTTG 


TCGAAATAGC 


3360 


AAGTGTTGCT 


GGCTTACAAG 


TTGATGAAAA 


ACAAACAAAA 


GCTGAAATTA 


TCAATGCTTT 


3420 


TGAGTCACTA 


GAGTAGGTGG 


TTATATGACT 


ACGCTAGCTG 


ATGTAAAAAA 


ACGTATTGGT 


3480 


CTTAAAGATG 


AAAAGCAAGA 


TGAACAATTA 


GAAGAAATCA 


TAAAAAGTTG 


TGAAAGCCAG 


3540 


TTGTTATCAA 


TGTTACCTAT 


TGAAGTTGAA CAAATACOGG AAAGgTTTAG TTACATGATT 


3600 


AAAGAAGTTG 


CAGTTAAACG 


CTACAACAGG 


ATTGGTGCTG 


AAGtATGACA 


TCAGAAGCGO 


3660 


TTGACGGACG 


TAGCAATGCG 


TATGAATTGA 


ACGATTtCAA 


GGAGTATGAA 


G CTATTATTG 


3720 


ATAATTACTT 


TAATGCTAGA 


ACGAGAACTA 


AAAAAGGAAG 


GGCTGTGTTC 


TTTTGAGATA 


3780 


TGAAGATAGA 


GTTATTTTTC 


AATTAGAACA 


AGTAGCAACT 


TACAATCCTA 


AAACTAGCAA 


3840 


AAAAGAAAAC 


ACACTAATCA 


CTTATGATGC 


GATACCATGC 


AATATTAACC 


CCATTTCTAG 


3900 


AGCAAGAAAG 


CAACTTGAAT 


TTGGTGATGT 


AAAAAACGAT 


GTAAGTGTTC 


TGAGGATAAA 


3960 


AGAATCAATA 


TCTTACCCTG 


TTAGCCACGT 


GTTGGTTAAT 


GGCATTCGCT 


ACAAGATAGT 


4020 


TGAmCAAGG 


ATATACAGAC 


ACGAAACGTC 


ATATTATATC 


GAAGAGGTCA 


ATTGATGAAT 


4080 


ATAGATGGAT 


TAGACGCACT 


GTTAAACCAA 


TTTCACGATA 


TGAAAACCAA 


CATTGATGAT 


4140 


GATGTAGATG 


ATATTTTACA 


GGAAAACGCC 


AAAGAATATG 


TAGTACGAGC 


TAAATTGAAA 


4200 


GCTAGAGAAG 


TAATGAATA 










4219 


(2) INFORMATION FOR SEQ ID NO: 213: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1999 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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GCTTACAAGT ATATTCATAA TTACATATTC AAGGTCCTTQ 


LAIu lv?vj AAT 


TTTGCTATGG 


60 




yCtTTaACTA CAACGGGGTC 


TAAGACTGCG 


TTTATCATAT 


IAAILAjILI i 


AuLLiAl 1CA1 


120 


£ 


. TyCTTTATkA AAAAGTTATT 


TAGTAGAAAT 


GCGGTAAGTG 




GTCAGTGATT 


180 




ATGCTGATAT TACTTTGTTT 


TACCTTTTAT 


AATATCAACT 


ACTATTTATT 


CCAAl lAAGC 


240 


10 


GACCTTGATG CCTTACCGTC 


ATTAGATCGA 


ATGGCGTCTA 


TTTTTGAAGA 


GGGCTTTGCA 


300 


TCATTAAATG ATAGTGGGTC 


TGAGCGAAGT 


GTTGTATGGA 


TAAATGCCAT 


TT CAGTAATT 


360 




AAATATACAC TAGGTTTTGG 


TGTCGGATTA 


GTGGATTATG 


TACATATTGG 


CTCGCAAATT 


420 


15 


AATGGTATTT TACTTGTTGC 


CCATAATACA 


TATTTGCAGA 


TCTTTGCX3GA 


ATGGGGCATT 


480 




TTATTCGGTG CATTATTTAT 


CATATTTATG 


LTWATTTAr 


TGTTTGAATT 


ATTTAGATTT 


540 




AACATTTCTG GGAAAAATGT 


AACAGCAATT 


GTTGTAATGT 


TGACGATGCT 


GATTTAGTTT 


600 


20 


TTAACAGTAT CATTTAATAA 


CTCAAGATAT 


GTYYVTrTTTA 

VJ A V>v\i X + X XJX 


TTTTAGGAAT 


TATCGTCTTT 


660 




ATTGTTCAAT ATGAAAAGAT 


GGAAAGGGAT 


CGTAA1Y3AAG 


AGTGATTCAC 


TAAAAGAAAA 


720 


25 


TATTATTTAT CAAGGGCTAT 


ACCAATTYIAT 


T AG A A C*fZ A TG 


ACACCACTGA 


TTACAATACC 


780 


CATTATTTCA CGTGCATTTG 


GTCCCAGFK3G 


A.V» A V9%9V9 A A A A 


GTTTCATTTT 


CTTTCAATAT 


640 




CGTGCAATAC TTTTTGATQA 


TTGCAAGTGT 


TGGCGTTCAG 


TTATATTTTA 


ATAGAGTTAT 


900 


30 


CGCGAAGTCC GTTAACGACA 


AACGGCAATT 


GTCACAGCAG 


TTTTGGGATA TCTTTGTCAG 


960 




TAAATTATTT TTAGCGTTAA 


CAGTTTTTGC 


GATGTATATG 


GTCGTAATTA 


CTATATTTAT 


1020 




TGATGATTAC TATCTTATTT 


TCCTACTACA 


AGGAATCTAT 


ATTATAGGTG 


CAGCACTCGA 


1080 


35 


TATTTCATGG TTTTATGCTG 


GAACTGAAAA 


G TTTAAAATT 


CCTAGCCTCA 


GTAATATTGT 


1140 




TGCGTCTGGT ATTGTATTAA 


GTGTAGTTGT 


TATTTTTGTC AAAGATCAAT 


CAGATTTATC 


1200 




ATTGTATGTA TTTACTATTG 


CTATTGTGAC 


GGTATTAAAC 


CAATTACCTT 


TGTTTATCTA 


1260 


40 


TTTAAAACGA TACATTAGCT 


TTGTTTCGGT 


TAATTGGATA 


CACGTCTGGC 


AATTGTTTCG 


1320 




TTCGTCATTt AG CAT ACTT A 


TTACCAAATG 


GACAGCTCAA 


CTTATATACT 


AGTATTTCTT 


1380 


45 


V>UVlil\JllCl X VtO 111 j\K3 1 J\ 


\j\9 lAUftl ALL 


AACAAGTTGG 


TATCrTTTCT 


AACGCATTTA 


1440 


ATATTTTAAC GGTCGCAATC 


ATAATGATTA 


ATACATTTGA 


TCTTGTAATG 


ATTCCGCGTA 


1500 




TTACCAAAAT GTCTATCCAG 


CAATCACATA 


GTTTAACTAA 


AACGTTAGCT 


AATAATATGA 


1560 


50 


ATATTCAATT GATATTAaCA 


ATACCTATGG 


TCTTTgGTTT AATTGCaATT ATG CCATCAT 


1620 




TTTATTTATG GTTCtTTGGT 


GAGGAATTCG 


CATCAACTGT 


CCCATTGATG 


ACCATTTTAG 


1680 




CGATACTTGT ATTAATCATT 


CCTTTAAATA 


tGTTGaTAAg CaGGCAATAT TTAtTAAtAG 


1740 
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TATGTAyTAT TTTGATATAT TTTTATGGAA TTTACGGTOC TGCTATTGCG CGTTTAATTA 1860 

CAGAGTTTTT CTTGCTCATT TGGCGATTTA TTGATATTAC TAAAATCAAT GTGAAGTTGA 1920 

ATATTGTAAG TACGATTCAA TGTGTCATTG CTGCTGTTAT GATGTTTATT GTGCTTGGTG 1980 

TGGTCAATCA TTATTTGCC 1999 



(2) INFORMATION FOR SEQ ID NO: 214: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 776 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
iC (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 214: 
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TCATTATTAA 


GACTATTATA 


TATAATGAAT 


TTTAACTGGT 


TTATTAAACG 


AGAACGTCGG 


60 


GAATTAAGTA 


ACTACAATAA 


AAATAAGATA 


TGACAATAAG 


GAGACTACAC 


GCGTGATCAT 


120 


TGCCATAATT 


ATATTGATAT 


TTATTTCGTT 


TTTCTTTTCA 


GGAAGCGAGA 


CGGCATTAAC 


180 


GGCTGCCAAT 


AAAACAAAAT 


TTAAAACTGA 


AGCTGACAAA 


GGTGATAAAA 


AAGCAAAAGG 


240 


CATTGTAAAG 


TTACTTGAAA 


AACCAAGTGA 


GTTTATTACA 


ACGATTCTAA 


TTGGGAATAA 


300 


TGTCGCGAAT 


ATTTTATTAC 


CAACACTTGT 


TACAATTATG 


GCTTTACGTT 


GGGGGATTAG 


360 


CGTTGGTATT 


GCATCAGCTG 


TTTTAACAGT 


TGTTATCATT 


TTGATCTCCG 


AAGTGATTCC 


420 


CAAGTCTGTC 


GCTGCAACAT 


TTCCAGATAA 


AATAACAAGG 


CTTGTATATC 


CAATTATTAA 


480 


TATTTGTGTC 


ATTGTGTTCC 


GTCCTATCAC 


ATTACTTTTA 


AATAAGTTGA 


CGGACAGTAT 


54 0 


TAATCGAAGT 


TTATCTAAGG 


GCCAACCTCA 


AGAACATCAA 


TTTTCAAAAG 


AAGAATTTAA 


600 


AACAATGTTA 


GCAATTGCTG 


GACATGAAGG 


TGCTTTAAAT 


GAAATTGAGA 


CGAGTAGGTT 


660 


GGAAGGTGTC 


ATTAATTTTG 


AAAATTTAAA 


AGTAAAAGAT 


GTAGATACAA 


CACCTAGAAT 


720 


TAATGTGACG 


GCATTTGCTT 


CAAATGCGaC 


ATACGAAGAA 


GTTTATGAAA 


CGGTTATGAA 


780 


TAAG CCATAC 


ACTAGATATC 


CAGTGTACGA 


GGGAGATATT 


GATAACATTA 


TTGGGGTGTT 


840 


TCATTCTAAA 


TATCTGTTGG 


CTTGGAGTAA 


TAAAAAAGAA 


AATCAAATTA 


CAAACTATTC 


900 


AGCTAAGCCA 


TTATTTGTGA 


ATGAACACAA 


TAAAGCTGAA 


TGGGTATTAC 


GTAAGATGAC 


960 


TATTTCTAGA 


AAACATTTAG 


CAATTGTGTT 


GGACGAATTT 


GGTGGTACTG 


AAGCGATAGT 


1020 


GTCACATGAA 


GACTTAATTG 


AAGAATTATT 


AGGTATGGAA 


ATTGAAGATG 


AGATGGATAA 


1080 


AAAGGAAAAA 


GAAAAACTTT 


CTCAACAGCA 


AATTCAATTT 


CAACAACGGA AAAATCGCAA 


1140 
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GTATTQAATA TCCAATTATA CAAGCAOGTA TGGCAGGAAG TACQACACCO AAATTAGTTG 1260 

CATCAGTAAG TAACAGTGGT GGGTTAGGCA CAATAGGCGC AGGTTACTTT AATACGCAGC 1320 

AATTGGAAGA TGAAATAGAT TATGTACGCC AATTAACGTC AAATTCTTTT GGOGTAAATG 1380 

TCTTTGTACC AAGTCAACAA TCATATACCA GTAGTCAAAT TGAAAATATG AATGCATGGT 1440 

TAAAACCTTA TCGACGCGCA TTACATTTAG AAGAGCCGGT TGTAAAAATT ACCGAAOAAC 1500 

AACAATTTAA GTGTCATATT GATACGATAA TTAAAAAGCA AGTGCCTGTA TGTTGTTTTA 1560 

CTTTTGGAAT TCCAAGCGAA CAGATTATAA GCAGGTTGAA AGCAGCGAAT GTCAAACTTA 1620 

1S TAGGTACAGC AACAAGTGTT GATGAAGCTA TTGCGAATGA AAAAGCGGGT ATGGATGCTA 1680 

TCGTTGCTCA AGGTAGTGAA GCAGGTGGAC ATCGTGGTTC ATTTTTAAAA CCTAAAAATC 1740 

AATTACCTAT GGTTGGAACA ATATCTTTAG TGCCACAAAT TGTAGATGTC GTTTCAATTC 1800 

CGGTCATTGC CGCTGGTGGA ATTATGGATG GTAGAGGAGT TTTGGCAAGT ATTGTCTTAG 1860 

GTGCAGAAGG GGTACAAATG GGCACCGCAT TTTTAACATC ACAAGACAGT AATGCATCAG 1920 

AACTACTGCG AGATGCAATT ATAAATAGTA AAGAAACAGA TACAGTCATT ACAAAAGCGT 1980 

TTAGTGGAAA GCTTGCACGC GGTATCAACA ATAGGTTTAT CGAAGAAATG TCCCAATACG 2040 

AAGGCGATAT CCCAGATTAT CCAATACAAA ATGAGCTAAC AAGTAGCATA AGAAAAGCCG 2100 

CAGCAAACAT CGGCGACAAA GAGTTAATAC ATATGTGGAG TGGACAAAGC CCGCGACTAG 2160 

CAACAACGCA TCCCGCCAAC ACCATCATGT CCAATATAAT CAATCAAATT AATCAAATCA 2220 

TGCAATATAA ATAATCGACC GCAATCCACA AAAGCACAAG CACCCCCAAA CATTATTTTA 2280 

35 GTGCTTGCCA TTTTTGTGGA TTGCGTTTCT ATTTTACCAA TTTAATCAAA CGAAAACATC 2340 

AAGCTGAAGA TCGCCGAAAG ATTTTAATCA AGCAAAAACA TCAAACTAAA GTTCGCTGAA 24 00 

ATGATTATGA TAAAAGTTAT ATGGTATGAT GACATTGGTG ATATATATGA TAAACATCGG 2460 

ATTAACAGGT TGGGGTGATC ACTATTCATT ATATGAAGAT TTAGAACGCC AAACCGATAA 2520 

ACTTAAAACA TATGCTGGAC ATTTTCCGGT TGTCGAATTA GATGCGACAT ACTATGCGAT 2580 

ACAACCGGAA AGAAATATAT TGAAATGGAT AAAAGAAACG CCTGATACAT TTGAATTTGT 2640 

GGTCAAAATT CATCAAGCAC TcACATTGCA TGCAGACTAC AAAACATTTG CAGATACAAG 2700 

GCAAGAACTA TTTGATCAAT TTAAGAATAT GTTAGAGCCC TTACATACAC AGAAAAAATT 2760 

AGCAATGGTA TTGGTTCAAT TTCCGCCATG GTTTGACTGC AATGCACAAA ATATCAAATA 2820 

TATTTTGTAT GTAAGACAGC AATTACAAGC ATTTCCAATG TGTGTAGAAT TTAGG CATCA 2880 

ATCATGGTTT AGTGATGCAT TTAAAGAACA AACATTGGCA TTTTTAACAG AACATCAAAT 2940 

55 



20 



26 



30 



40 



45 
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AATCACAAAT GAAATTGCGT TTGTACGTTA 
GAAAGATATG TCAGATCAAG AATGGCGCGA 
5 AGAATTAATA GACTTGGCAC AAAAGGCACA 

CGTCATATTT AACAATAATT CTGGTGGTCA 
ATTATTGAAT ATAGAATATG AAGGGTTAGC 

10 

GACGACTATG TTATTAACAA TTACATTATT 
AGGGTCTATC GTAGGCATTG GAGGOGGTAT 

1S TGTTGAACAT GGATTACTAC ATAATATTAC 

CATTCTAATT GTGACAGGAC TTTCTTCATC 
TATTAAAAAT GGTTCCATCT TTTTATTTGG 

20 CATTAGTAGA TATTTAACAT TTGAGTCATT 

CGTAGCCATT TTATTAATGG TAAGAAATAA 

CAAGTATGAA AAGACTTATG TAGACGCTAA 

25 

ATTGTTTGCT TTTATTACAA CGTTTTTAAT 

AGGTGGCGCA CTAATGACGC CACTAATGCT 

TGTTGGAACA AGTATGATGA TGATTTTCTT 

30 

TGCTCAAGGT CACGTAGCTT GGGGTTATGC 
TGCGAAAATC GGTGTCAAAG TGAATCAATC 

3S GAGAAGAGTA ATGTTGTTAA TGGGTATATA 

CTTTAAAAGG AGGACGTCAA TTTGAGGCTT 
CATTTACATG AATACGAACG CATTAAAGCA 

40 CATCCTTCTT TATATGTTGA TCTAGGTGAT 
GCAACTTTAG GTAAAAAGAA TGTGGCATTA 
ATCGGTAATA ATGAAGGGAT GACCATTTCA 

45 

GCAAAATTTA TAGTGACATG TAGCAATGTT 

ATCGTTTCTT CTTATATTAA GGACATAGAC 

£0 GCACCTTTTA CCCCATTTTA TCGTGCACTA 

ATAAAAGAAG AAATTGAACT TCAACGAGGT 

TGTGGCATTT TCTTCGATGA AACATTATGC 
55 
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TCATGGACGT AATCATTACG GTTGGACTAA 3060 

TGTACGCTAT TTATATGATT ATAATGAGCA 3120 

AATATTAGCA CAAAAAGCTA AGAAAGTTTA 3180 

TGCAGCAAAT AATGCCAAAA CATATCAGCG 3240 

ACCACAACAA TTAAAATTAT TTTAAGAGGC 3300 

AGTTTTAATC GGAGGTTTGT CAGCGATTAT 3360 

TATTATCGTT CCAACAATGG TTTACCTCGG 3420 

AACACAAGTA GCGATAGGGA CGTCTTCAOT 3480 

ACTTGGATAT TTAAAAACAA AACAAGTTGA 3540 

ACTATTACCA GGTTCATTGC TTGGGTCCTT 3600 

TAATTTATAT TTTGGTATCT TTTTAATTTT 3660 

GATTAAACCG TTTAAAATTT TCGATAAACC 3720 

AGGTAAAACA TATCATTATA gTGTTCCACC 3780 

TGGTATATTG ACAGGTTTAT TTGGTATTGG 3840 

TATTGTATTT AGATTTCCAC CTCATGTAGC 3 900 

TTCAAGTGTC ATGAGTTCTA TAGGGCACAT 3960 

AATCATnTTA ATTATTTCTA GTTATTTTGG 4020 

AATTAAGTCA GATACGGTAG TAACATTATT 4080 

TTTAATTATT CGTGCGTTGA TTTAATACAA 4140 

ACAATTTATC ATACGAACGA TATTCATAGT 4 200 

TATATGGCAG AACATCGGCC ACGACTTAAT 4260 

CATGTAGATT TATCCGCACC TATAACTGAA 4320 

CTAAATGAAG CAAAATGTGA TGTTGCAACA 4380 

TACGAAGCTT TAAATCACCT TTACGACGAA 4440 

ATAGATGAAT CAGGTCATTT ACCAAATAAT 4500 

GGTGTGAAAA TACTATTCGT TGCAGCGACA 4560 

AATTGGATTG TTACCGATCC ACTTGAATCT 4620 

AAATTTGATG TATTAATCGT GCTAAGTCAT 4680 

CAAGAATTGC CTGAAATTGA TGTCATTTTT 4740 
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GCAgCTGGAA AGTATGGTAA TTATCTTGGA GAGGTTAATT TAACTTTTGA GGCACATAAA 4860 

GTAGTACATA AAACTGCAAA GATTATTCCT TTAGAAACAT TACCTGAAGT TGAAACTTCA 4 920 

TTTGAAGAAG AAGGAAAAAC GTTAATGTCC AATTCAGTAA TTCAACATCC AGTAGTGCTT 4 980 

AAGCGTAGTA TGAATCACAT AACTGAAGCT GCATACTTAT TAGCTCAAAG TGTTTGTGAG 5040 

TATACACATG CACAATGTGC CATCATCAAT GCTGGCTTAC TCGTTAAAGA TATTGTAAAA 5100 

GATGAAGTGA CAGAATATGA CATTCATCAA ATGTTACCGC ATCCGATTAA TATGGTAAGG 5160 

GTTAGACTTT TTGGTGTGAA ATTAAAAGAG ATTATAGCTA AAAGTAATAA ACAAGAATAT 5220 

ATGTATGAAC ATGCACAAGG TTTGGGTTTC AGAGGGAATA TATTTGGAGG ATATATTCTT 5280 

TATAATTTAG GGTACATTCA TTCTACAGGG OGTTACTATC TGAATGGAGA AGAAATCGAA 5340 

GACGACAAAG AATATGTACT AGGTACGATA GATATGTATA CGTTCGGTCG TTATTTCCCA 5400 

20 ACATTGAAAG AATTACCAAA AGAGTATTTA ATGCCAGAGT TTTTAAGAGA TATATTTAAA 5460 

GAAAAATTAT TGGAATATTA AAAAGTAAGA TTATTGGATT TTCATTTGTC ATGAATTTCG 5520 

ATATAATGTT TAAAGATACA CTTAACAGGA GGGTATGTGT TGTTATGGCG ACAAAAAACG 5590 

AGGAAATATT ACGTAAACCG GATTGGTTGA AAATAAAATT AAATACCAAC GAAAACTATA 5640 

CAGGACTTAA GAAGATGATG AGGGAAAAAA ATCTTAATAC TGTATGTGAA GAAGCTAAAT 5700 

GTCCTAATAT ACATGAATGT TGGGGTGCAC GTCGTACAGC GACATTTATG ATTTTAGGTG 5760 

CCGTATGTAC AAGAGCTTGT CGTTTTTGTG CGGTTAAGAC AGGTTTACCT AATGAACTTG 5820 

ATTTAAATGA GCCTGAACGT GTAGCTGAAT CAGTTGAATT AATGAATTTG AAACACGTTG 58B0 

35 TTATCACTGC TGTTGCGCGT GATGATTTAA GAGATGCTGG TTCAAATGTT TATGCTGAGA 5940 

CAGTACGTAA AGTTAGAGAA AGAAATCCAT TTACAACGAT TGAAATTTTA CCATCAGATA 6000 

TGGGCGGGGA CTATGATGCG TTAGAAACAT TAATGGCGTC AAGACCTGAC ATTTTAAACC 6060 

40 ATAATATTGA AACTGTTCGT CGCTTAACAC CGAGAGTTCG TGCGCGTGCG ACTTACGACA 6120 

GAACATTAGA GTTTTTACGT CGTTCAAAAG AATTACAACC GGATATCCCA ACTAAATCAA 6180 

GTATTATGGT TGGATTAGGT GAAACTATAG AAGAAATTTA TGAAACGATG GATGATTTAC 6240 

GTGCGAATGA TGTAGATATT TTAACGATTG GTCAATATTT ACAACCTTCA CGTAAACATT 6300 

TAAAGGTTCA AAAATATTAC ACGCCTTTAG AGTTTGGTAA ATTAAGAAAA GTGGCAATGG 6360 

ATAAAGGGTT TAAACATTGC CAAGCTGGAC CTTTAGTACG TAGTTCTTAT CATGCGGATG 6420 

AGCAAGTAAA TGAAGCTGCT AAAGAAAAGC AACGCCAAGG TGAGGCACAG TTAAATAGTT 6480 

AATATTTAAC CATTAATAAG GCATAAAGGC TTAGTTTGTA CAAAACGAAC GTGTCATAGA 6S40 
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AGGTGAAGAA TTTGATAAAA GTAGATCAAC ATTACTTTGA ATTAATAGAA AATTATCGCG 6660 

AATGTTTTAA TGAAGAACAA TTTATTGCTA GGTATTCAGA TATTTTAGAT AAATATGATT 6720 

ACATAGTTGG TGACTATGGT TACGATCAAT TACGATTAAA AGGTTTTTAC AAAGATTCTA 6780 

ATAAAAAAGC AGAGATGAGT AAACGTTTTT CAAATATTCA AGATTACATA TTTGAATATT 6840 

GTAACTTTGG TTGTCCTTAC TTTGTATTAA GACATTTGTC TAAACAAGAG GTTAAAAAGT 6900 

TAATCGAAGA AGTTCATCCG TCTGATGTGA TAGATGACGA CAATAAACTT CAAGATGTGA 6960 

AGATTAAGCC AACCATTCAA GATACTGAAC ATTAATAAAA CCCTTAGCTA GATTGAAAAT 7020 

1S GGGAATCATG CAATTCAAGC ATGGACCTGT AATCTAGTTA GGGGTTTTTA TCTTTAATGA 7080 

ATGACTTCAT TTAAATACTC AGTAATTTCA TCGCCTTCTT CAGCATTTAC ACCTAAAATA 7140 

TGAGCGATAT AGCCTTCTTC TTTTAAATCA TCAGTACCGA TAATACCGAA TTTATTTGTT 7200 

20 TGCATATTAA GTACGAGTGT CTTACCATAA TGTCTATTTG TATGGACTAA CATCAAATCA 7260 

TATCGACTAT GCTCGCCAAC AAAACCAACA AACTGAACTT GACTCTCTTC GTTGTCATCA 7320 

TATAAATACA TATCAATCAT TTTGTAGCGA CTCCTTTTAA AAGTAGTAAA GTTAGTATAA 7380 

CGACAAATGA AGTATACTGC AAAATTATGA TAATATATAA GTGAGAGGTG ACAAGGAATG 7440 

TATTTTGTAG ACAAAGATAA ACTAACTCAG AAATTAGCCT ATTTACAAGC ATTAACTGAT 7500 

GATTATCATG AGAGCAAGCA CAATCATTAT GCATTTGAAC GCATTGCTCA AATGTTGATA 7560 

GAATCATCGG TAGATATAGG GAATATGATT ATCGATGCAT TTATTTTAAG GGATCCTGGT 7620 

AATTATAAAG ATGTGATTGA TATATTAGAA CT AG AAAATG TTATTACTAA AGAAACACAG 7680 

CAGGCGATTA ATAAAACTGT CGGTATTCGT AAACAATTTA CATATGATTA CACAGCCTTA 7740 

gatgttgaga ttatcatgcc aatgtttga 7769 
(2) Information for seq id no: 215 : 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 644 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 215: 

ACCGCCACCC ATTAATGATT GCTTAAAATC AATAGTCGTA CCATTTAATA CGGGTGCATC 60 

TTTTTTGTCT ACTAATACTT TTAATCCAAA GTATTCTAAG ACTTCATCAT TTTCAC CAGG 120 

CGCTTCTTCT GCACCCATAC CGTATGTTAA ACCAGTGCAC CCGCCACCAT TCACTTTAAT 180 
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TOCTTCTOTT AATATAACTG TTGGCATGAT AACTCCTCCT TAAAAAATCC AAGTTTCTTT 300 

TATATGTGCA TATATATTTT GTAATAATTC TTCCGGCGAA TCACCTTCAA CAATATCACC 360 

5 

ATTTACTAAA GCATACAACC CGGCTOAACA TATACCACAA TGTGTCAGGC AACCATACTC 420 

TAACACATCG ACATCTGGGT CATTTTCCAG TTGATTAAAA ACATAATCTC CACCTTTTGC 480 

1Q CATGTTAGAG AGACAAAATT CTACGATCGG ATTCATACTT CACCTTCTTA TTTCATTTGT 540 

TACAATATTA TAGCATTTTA AAACTGGTAT TTTAACATGA TGTGCTCAAT TAGCAACAAC 600 

TGATGTTTCT TATCCCAGTT ATGTAATAGT GCCTTAGTTA GTAC 644 

is (2) INFORMATION FOR SEQ ID NO: 216: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1576 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 216: 

25 





GAATGATGAA 


AGGAATAGAA 


AAGAAAAGAT 


AAATAATGTA 


ATAGATTTAT 


CCGAGAAAAT 


60 




TOAAAGAACA 


AAAGATATGC 


CAATCAAGAA 


TACTATAACT 


ACTCAATTAG 


GAAATAAACT 


120 


30 


TATTGGCACA 


AAAAAAGCTC 


GTTTTGATGA 


TAAGAAAGTA 


GTGTCGTTTG 


GAGCATTTGA 


180 




AGATGAATAA 


AATAAATGAT 


AGAGATTTAA 


CAGAATTGAG 


TAGCTATAGG GTTTATCAAG 


240 




ACATCAATAA 


AGATAATGAC 


TTTACAGTTA 


ACGAAAAACG 


ATTTAAGCAG 


GCAGATGTAT 


300 


35 


TTGAAGATTT 


ATATAGAGAG 


AAACTAAAAG 


ACACAAATAA 


ATTAAGAGAG 


TATAATTATT 


360 




TACAAAATGA 


AACTTTTAAA 


AGCGCATAAA 


TAGGTGATGA 


GATATGCTTA 


AAAAAGCAAA 


420 




ATTTfiTCTTA 


ATGGCAACGA 


TACTACTATC 


AGGATGTTCA 


ACTACCAATA 


ACGAATCCAA 


480 


40 


CAAAGAAACA 


AAATCTGTAC 


CAGAAGAAAT 


GGATGCTTCA 


AAATATGTAG 


GACAAGGATT 


540 




CCAACCACCT 


GCAGAAAAAG 


ATGCGATTGA 


ATTTGCAAAG 


AAGCATAAAG 


ATAAAATTGC 


600 


45 


TAAGCGAGGC 


GAACAATTTT 


TTATGGATAA 


CTTCGGTCTA 


AAAGTTAAAG 


CTACAAATGT 


660 




TATAGGTAGT 


GGCGATGGTG 


TAGAAGTATT 


CGTGCATTGT 


GATGACCACG AyATCGTATT 


720 




TAATGCGAGT 


ATTCCATTTG 


ATAAATCAAT 


wATTGAsAGT 


GATAGCTCAT 


TAAGAAGTrA 


780 


50 


GGAyAAAGGy 


GATGATATGA 


GTACTTTAGT 


TGGTGCAGTA 


CTCAGTGGGT 


TTGAATATCG 


840 




AGCACAAAAA 


GAAAAATATG 


ATAAATTATA 


TAAATTTTTC 


AAAGATAATG 


AAGAGAAATA 


900 




TCAATATACA 


GGATTTACAA 


AAGAAGCAAT 


TAATAAGACG 


CAAAATAGTG 


GTTATGAAAA 


960 
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ACCATTGTTA AACAAAAGTG ACAGTGAATT TTCAAAAGAA TTGTCAAATG TTAAOAAGCA 1080 

ATTAAAAGAT AAGTCTAAAG TTTCGGTAAC TACTACTCTA TTTAGTAAAA AAAAGAACTA 1140 

5 

TACTAAAAAA AGTAACAGTG AAAATGTAAT AAAAATGGCA GAAGAAATAA AAAAAGATAA 1200 

AGAGATACCA AACGGTATAG AGCTTAGTAT AAAATTTTCG GACAATAAAA TAAATACGOT 1260 

10 TAAACCAAAT TTTAACGGTG aAAGCACTTC AGAATATGGT GTGTTTGATC AAGAATAAAA 1320 

TTAATGATGa AAATTTAACG GAGAATAGTG TATATTGAGT AGATCmAGAA TAAAAAGATA 1380 

ATTCTACTAT TGTTGTGAAG GCAAATAAGT AGAAGATTTT AAGTGTAATT TCTGGTGATT 1440 

15 TAAATAATAA TATAnATGGn AGTACTGATA TAAnACTTTT TAACCTACTA GATTCTTATA 1500 

ATTTGCTTTC CATTTTATGA CGATTTTTAC TCCAATTGAG TGATAGAATC CAAAAAAGCC 1560 

ATCTCCAAAA ATTAATCC 1578 

20 

(2) INFORMATION FOR SEQ ID NO: 217: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5137 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



30 ( X i) SEQUENCE DESCRIPTION: SEQ ID NO: 217: 





TGTTTTCCTT 


GGG TTAAAAC 


ATGCTTGCTA 


TGCGTTTGTA 


AATATGACTT 


GCTGTTTTnA 


60 




CCTGnATACC 


CGTCACACCA 


TGGAAGTAAA 


AATGTTTCTT 


GCTCTTGGCT 


TACAATTTTA 


120 


35 


GCTTTAATCG 


CTTCATATGC 


TTTATATTGG 


TCTTCTGTTA 


ATTGCTGTTT 


TGATTCTTGT 


180 




TCGAAAACAC 


GATCTTTAAA 


TGGGTCTCTT 


TCAACAACCG 


CGTCATATTT 


TTCAACATAA 


240 


40 


CCTTTTTTGA 


TAAGTCCATC 


TAAACTGGAT 


TTTGAAAAGC 


CCATATCCTC 


AATATCAGTT 


300 


AAAAATATTG 


TTTTATGTTG 


TTCTTCAGAC 


AAGTAAGCAT 


ACAAATCGTA 


TTGTTTAATA 


360 




ACTTTCTCCA 


ACTTAGCTAA 


TACTTCATCA 


GGATGATACC 


CTTCAATGAC 


ACGAACAGCA 


420 


AS 


CGCTTGGTTT 


TTTTAGTTAT 


ATTTTGTGTG 


AGAATCGTTT 


TTTCTTCAAC 


GATATCATCT 


480 




TTTAACAACT 


TCATAAGCAA 


TTGAATATCA 


TTATTTTTTT 


GCGCATCTTT 


ATAATAATAG 


54 0 




TAACCATGCT 


TATCAAATTT 


TTGTAATAAA 


GCTGAAGGTA 


GCTCTATGTC 


ATCTTTCATC 


600 


60 


TTAAATGCTT 


TTTTATACTT 


CGCTTTAATA 


GCACTCGGAA 


GCATCACTTC 


TAGCATAGAA 


660 




ATACGTTTAA 


TGACATGAGT 


TGAACCCATC 


CACTCACTTA 


AAGCTATTAA 


TTCTGATGTT 


720 




AATTCTGGTT 


GTATATCTTT 


CACTTCTATG 


ArrrriTriA 


ACTTCGAAAC 


GTCAAGTTGT 


780 
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ACAATTACAC GCACACCAGG TTGGATGACA GATTOGAGTT GTTCGGGAAT TATATAATCA 900 

AATTTATAGT CAACGCTCTT CGACGCGACA TCGACTATGA CTTTCGCTAT CATTATTGCC 960 

5 

ACCTAGTTTC TAGTTCATCT AAAATTTGTG CAGCTAATAC TACTTTTTTT CCTTTCTTGA 1020 

TATTTACTTT TTCATTATTT TTAAAATGCA TTGTCAATTC ATTATCATCA GAACTAAATC 1080 



10 



1S 



20 



25 



40 



CGATAGACAT 


ATCCCCAACA 


TTATTTGAAA 


TAATCACATC 


TGCATTTTTC 


TTGCGTAATT 


1140 


TTTGTTGTGC 


ATAATTTTCA 


ATATCTTCAG 


TCTCTGCTGC 


AAAGCCTATT 


AAATACTGTG 


1200 


ATGTTTTATG 


TTCACCTAAA 


TATTTAAGAA 


TGTCTTTAGT 


ACGTTTAAAA 


GATACTGACA 


1260 


AATCACCATC 


CTGCTTTTTC 


ATCTTATGTT 


CTAATACATC 


AACCGGTGTA 


TAGTCAGATA 


1320 


CGGCTGCTGC 


TTTTACAACA 


ATATCTTGTT 


CGTCAAATCG 


GCTTGTCACT 


TGTTCAAACA 


1380 


TTTCTTCAGC 


ACTTTGAACA 


TGAATAACTT 


CAATATCTTT 


TGGATCCTCT 


AGTGTTGTAG 


1440 


GACCAGCAAC 


TAACGTCACG 


ATAGCTCCTC 


GATTTOGCAA 


TGCTTCAGCT 


ATTGCATAGC 


1500 


CCATTTTTCC 


AGAAGAACGA 


TTGGATACAA 


ATCTGACTGG 


ATCGATAACT 


TCAATAGTTG 


1560 


GTCCTGCTGT 


AACCAATGCG 


CGTTTATCTT 


GAAATGAACT 


ATTAGCTAAA 


CGATTACTAT 


1620 


TTTGAAAATG 


AGCATCAATT 


ACAGAAACGA 


TTTGAAGCGG 


TTCTTCCATA 


CGTCCTTTAG 


1680 


CAACATAACC 


ACATGCTAGA 


AATCCGCTTC 


CTGGTTCGAT 


AAAATGATAC 


CCATCTTCTT 


1740 


TTAAAATATT 


AATATTTTGC 


TGCGTACGTT 


TATTTTCATA 


CATATGCACA ; 


TT CAT AGCAG 


1800 


GCGCAATAAA 


TTTCGGTGTC 


TCTGTTGCTA 


GCAACGTTGA 


TGTCACCAAA 


TCATCAGCAA 


1860 


TACCTACACT 


CAATTTTGCA 


ATTGTATTTG 


CCGTTGCAGG 


TGCAACAATG 


ATTGCATCTG 


1920 


CCCAATCACC 


TAATGCAATA 


TGCTGTATTT 


CTGAAGGATT TTCTTCTATA 


AAAGTATCTG 


1980 


TATAAACAGC 


ATTTCGACTT 


ATTGCTTGAA 


ATGCTAATGG 


TGTCACAAAT 


TTTTGTGCGT 


2040 


GATTSGTTAA 


CATAACGCGA 


ACTTCATACC 


CAGATTGTGT 


TAACTTACTT 


GTCAAATCAA 


2100 


TTGCTTTATA 


TGCCGCAATG 


CCACCTGTAA 


CGGCTAATAA 


TATTTTCTTC 


ATATTCAATC 


2160 


TCCCTTAAAT 


ATCACTATGA 


CATTTAGGCT 


TTACATCATC 


ATATGCGCAC 


AAATGCTCAT 


2220 



TACTTTTTTA TAGATACAAA TTTAGTATTA TTATAACATC AATCATTGGA TAAACTAAAA 2280 

45 

AAACACACCT ACATAGGTGC GTTTGATTTG GATATGCCTT GACGTATTTG ATGTACGTCT 2340 

AGCTTCACAT ATTTTTAATG GTCGAAACTA TTCTTTACCA TAATAATCAC TTGAAATAAC 2400 

SO AGGGCGAATT TTACCGTCAG CAATTTCTTC TAACGCTCTA CCAACTGGTT TAAATGAATG 2460 

ATATTCACTT AATAATTCAG TTTCAGGTTG TTCATCAATT TCACGCGCTC TTTTCGCTGC 2520 

AGTTGTTGCA ATTAAATACT TTGATTTAAT TTGTGaCGTT aATTGGTTtA AAgGTGGATT 2580 
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TTTArGTGcT CAGCTTCTAC AATACATTGA ATTCtATTCy TCGcAAGtTC TACTTCAtCA 2700 

TTAACTACAA cGTAAyCGTA TAAATTCATC ATTTCrACTT CTkTACGCGC yTCGTTAATA 2760 

CGACTTTGTA TTTTCTCATC AOATTCTGTT CCTCTACCTA CTAATCGCTC TCTCAAGTGT 2820 

TCTAAACTTG GAGGTGCTAA GAAAATAAAT AGCGCATCTG GAAATTTCTT TCTAACTTGC 2880 

TTTGCACCTT CTACTTCAAT TTCTAAAAAT ACATCATGAC CTtCGTCCAT TGTAT CTTTA 2940 

10 

ACATATTGAA CTGGTGTACC ATAATAGTTG CCTACATATT CAGCATATTC TATAAATTGG 3000 

TCATCTTTGA TTAAAGCTTC AAACGCATCC CTAGTTTTAA AAAAGTAATC TACGCCATCA 3060 

15 ACTTCACCTT CACGCATTTG ACGTGTTGTC ATTGAAATAG AATACTTATA TOATGTACTT 3120 

GGATCTTCAA ATATnCGTllT TCTAACAGTA CCTTTACCTA CTCCAGATGG TCCTGATAAA 3180 

AOGATTAACA ATCCTTTTTC ATTATCCATG CCTTACGACC TCTCTAAGCT AATCTTCTAT 3240 

20 TATTTAAATA TGATATCACA TTGTT CTTTA TATTGTATAG CATATTTOAA ATTGCATGCC 3300 

ATAATTTCTA TTAAGTCTAA CAATATCGTT ATATTG CACG ATTAATTTTA ATTAAATAAA 3360 

TTGAATTGCA AACTTTTAGA TAATGTAAAA TGTATGGCAT AATGTATGGT TCAATAACTA 3420 

25 

TACTCAAAAG TTACAATCAT GTTAAAATGA AACGAATGAT ATGAAGAAGG TGGAAGATAA 34 80 

ATTATGGCTT ATGATGGCTT ATTTACAAAG AAAATGGTTG AGTCTCTACA ATTTTTAACA 3 54 0 

30 ACAGGACGTG TTCACAAAAT CAATCAACCT GATAATGACA CGATACTAAT GGTTGTACGT 3600 

CAAAATAGAC AAAACCATCA ATTGTTATTG TCAATCCATC CAAACTTTTC AAGATTACAA 3660 

TTGACTACTA AAAAATATGA TAATCCATTT AATCCACCCA TGTTTGCGCG TGTTTTTAGA 3720 

35 AAACACTTAG AAGGTGGTAT TATCGAATCG ATTAAGCAAA TTGGTAATGA TCGTCGCATT 3780 

GAAATCGATA TAAAGAGTAA AGATGAAATT GGCGATACTA TTTACCGCAC TGTCATCCTT 3840 

GAGATTATGG GTAAACATAG TAACTTAATT TTAGTAGATG AAAATCGCAA AATAATTGAA 3 900 

40 

GGATTTAAAC ACTT AACAC C AAATACGAAT CACTATCGTA CAGTAATGCC AGGATTTAAT 3 960 

TATGAAGCAC CACCTACTCA GCACAAAATA AATCCGTATG ATATTACAGG TGCAGAGGTG 4020 

TTGAAATATA TCGATTTTAA CGCAGGTAAT ATTGCTAAAC AATTATTGAA TCAGTTTGAA 4080 

45 

GGATTTAGCC CTTTAATTAC GAATGAAATC GTTAGTCGTC GTCAATTTAT GACTTCATCA 4140 

ACATTACCAG AAGCATTTGA CGAAGTAATG GCAGAAACCA AGTTACCACC TACTCCTATT 4200 

So TTTCATAAAA ATCATGAAAC AGGTAAAGAG GATTTCTATT TTATAAAGTT AAATCAATTT 4260 

AATGATGATA CAGTTACATA CGATTCATTA AATGATTTGC TTGATCGTTT TTATGATGCG 4320 

CGTGGCGAAC GTGAACGCGT TAAACAACGT GCGAATGATT TAGTTCGATT TGTTCAACAG 4380 

55 



966 



EP0 786 519 A2 



ATAAAGATAC TGAACAGTTA TATGGTGAAT TGATCACTGC TAATATATAT CGAATTAAGC 4 500 

AAGGCGATAA AGAAGTGACG GCATTGAATT ATTATACGAA TGAAGAAGTT GTCATTCCTT 4560 

S 

TAAATCCTAC AAAATCCCCA TCAGCAAATG CTCAATATTA TTATAAACAA TATAAyCGTA 4620 
TGAAAACGAG AGAmCGTGAA TTACAACATC AAATTCAATT GACGAAAOAC AATATAGATT 4680 

10 ATTTTTCAAC AATCGAACAA CAATTACATC ATATTTCTGT CCATGACATT GATGAAATTA 4740 

GAGATGAATT AGCAGAACAA GGCTTTATGA AACAGCGTAA AAATCAAACT AAGAAAAAGA 4800 
AAGCGCAGAT TCAATTACAA CATTATGTAT CAACTGATGG CGACGATATA TATGTTGGTA 4 860 

15 AGAATAACAA GCAAAATGAT TATTTAACAA ATAAAAAAGC TAAAAAAACT CACACATGGT 4920 

tACACACAAA AGATATTCCT GGTTCACATG TCGTTATATT TAATGATGCA CCAAGTGATA 4980 
CGACAATCAA GGAAGCGGCT ATGTTAGCAG GATACTTTTC AAAAGCTGGT AATTCTGGAC 5040 

20 

AAATACCTGT TGATTATACA TTAATTAAAA ATGTGCATAA ACCATCaGGT GCAAAGCCTG 5100 
GGTTTGTAAC ATATGACAAT CAAAAAACTT TGTATGC 5137 
(2) INFORMATION FOR SEQ ID NO: 218: 

25 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2267 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
30 CD) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 218: 



40 



45 



SO 



GTTTTATCGC 


AGCAGTAAAG 


CTATCAATCG 


GCGGTTCAAT 


TGATGATGCA 


TTAGCAGAAA 


60 


TCAnACAATC 


ATTTTAGTTA 


AAATTTACTA 


ATAATGAaAA 


ATGTAAACCT 


TTTTCAAATG 


120 


AAACTTTATa 


AaAAATATGA 


TAGTATATAT 


GTAAATGTTT 


AATAAAATCT 


GGAGAAATAG 


180 


GAGGACATTG 


CCATGCAACA 


CCTTATAAAA 


AAACATGTAT 


TGAATGGCGA 


GTTTGATTTA 


240 


GTACGACAAT 


TGATGTCCGA 


AACAGATTTT 


ATGGAATTTG 


AAGAAGCATA 


TATTTCAAGT 


300 


GCGCATGAAG 


TAGAAAGTAT 


GATGTTTTAT 


ACATGTATTT 


TAGATATGAT 


TAAGTACGAA 


360 


GAATCATCTG 


AAATGCATGA 


CTTAGCATTT 


TTATTGCTTG 


TGTATCCACT 


AAGTGAATAT 


420 


GAAGGTGCTT 


TGGATTCTGC 


TTATTATCAT 


GCAGACGCTT 


CCATAAAACT 


TACTGACGGC 


480 


AAAGAAGTTA 


AAAGTTTGTT 


ACAAATGTTA 


TTATTGCATG 


CGATACCAAC 


ACCTGTTATT 


540 


TCAGATAAGA 


AGGCTTTTGA 


TATCGCCAAG 


CAAATTTTAA 


AATTAGATCC 


TAATAATAAT 


600 


GTTGCTCGTA 


ACGTCTTAAA 


AGACACTGCC 


AAACGTATGC gACAaCGTTG TTGTTGATAT 


660 
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10 



15 



20 



25 



30 



35 



40 



45 



60 



SS 



AGTTTTAACA TTTGGTTGGG TTGGGCATAT GTTCCAGCCT TTTTTAATAC TTAAAAACTA 
ACGAAgTATA CTTGTGTGCA CAAATGGTTT TTATACAACA TTTTATAAAT TTATACATTT 
TAATAAAGAA CATACGATAG ATGGTTTAAA CCTTCTTAAC TGAGAAATTT TGATATGTAT 
TCTTCGAAAT TTAACTAAAT ATACGAAATT CAAGAAGCAC AATAATTAAT CATTTTTCCT 
ATACAAAAGT TCGTATGACT GCATTATAAA AGCATAAATT TATAATTTTT TTAAATGTCA 
TTGAACGTGA TAATGTGAAT GGATTGAGCA ATTTTGAAAA AGTGAAAAAT AACCTATGCG 
ACTTGCAATT AATTTTCAGT ACGTTATAAT GCACACTGTG CAAAATTAAG GAGGTCTATT 
ATTCACATGA TGATGAaTAA AGAAGCAACA AAAATTGGAT TTGCCTACGT CGGCATTGTA 
GTGGGCGCAG gATTTTCAAC TGGACAAGAA GTTATGCAAT TTTTCACTAA ATATGGCTTG 
TGGGCTTATT TAGGTGTTAT TATATCTGGT TTTATTTTAG CTTTTATTGG GCGCCAAGTA 
GCAAAAATTG GTACTGCCTT TGAAGCGACA AATCATGAAT CAACATTACA ATACGTATTC 
GGTGAAAAGT TTAGTAAAGT CTTTGaTTAT ATTTTAATCT TCTTCTTATT TGGTATAGCT 
GTAACCATGC tAGCTGGTGC AGGCGCAACA TTTGAAGAAA GTTATAACAT ACCTACATGG 
CTAGGTGCTT TaATTATGaC ATTAGCGATT TATATTACGT TGCkATTAGA CTTTAATAAA 
ATAGTACGTG CACTAGGTAT CGTTACACCA TTTTTAATTG TTTTAGTTGT ATTAATCGCT 
GGCGTTTATT tATTTAAAGG TCATGtTTCA TTAGCAGAAG TTAACCAAGT AGTGCCtGAA 
GCAAGTATTT GGAAGGGAAT CTGGTTTGGT ACAATATATG GTGGATTAGC TTTTTCTGTA 
GGTTTTAGTA CCATCGTAGC AATCnGTGGG GATACTGAAA AGCGTACAGT GTCAGGTGCA 
; GGCGCGATGT ATGGTGGTAT TATCTATACT GTATTACTAG CATTGATCAA CTTTGcATTG 
CAAGTGaATA TCCAACTATT AAAAATGCCT CAATTCCTAC ATTGACGTTA GCAAATAATA 
TCCAtTCCTTT AATAGGAACA GTGkTATCTG TTATTATGCT GGCGGkTATG TATAATACTA 
TTCTAGGACT AATGTATTCA TTTGCAGCAC GTTTTACAGA ACCATACAGT AAAAATTATC 
ATATCTTTAT TATTATAATG ATGGTAGCAG GTTATTTATT AAGTTnCGTA GGATTTGCTG 
AATTAATTAA TAAGTTATAT ACnATTTATG GGATATGTAG GCTTATTnTA TTGTAGTAGC 
TGTAATTATn AAATATTTCC AAACGTAAAA ATGGCGGATA AAAAACATAT TGCTTTAATA 
TCATATGGAG GGGATATCCG AAACTTTACA ATTTGAATCA CTTTGGT 
(2) INFORMATION FOR SEQ ID NO: 219: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 63 36 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 



780 
840 

900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2267 
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10 



20 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 219: 

GTCAATGTAA CCTAATAGTT TATGTCTATC TTGTGTACCA ACTACTACAT CGACACCAGG 60 

AATTTCCATA ATTTCAGCTG ATGAAGTTTG CGCATAACAA CCTGTTACAC AGATTACAGC 120 

ATCAGGATTT TQTCTTATTG CAOGTCTAAT TATTTGACGA CTTTTTTTAT CACCCGTATT 180 

CGTTACTGTA CAAGTATTAA TAACAAATAC ATCAGCATTC GCTTCAAAGT CAACGCGCTC 24 0 

ATAGTTTGCT TCTTTAAATA ATTGCCAGAT TGCTTCAGTT TCATAATGGT TTACTTTACA 300 

75 ACCTAATGTG TGaACGCAAC TGTTGACATA AATATTCACC CCATTAATTC TTTTTCATAA 360 

CTTATTGCAC TTAACGCATA CAATGGCGCA GTTTCTGCCC GTAAAATTCT CGGCCCAAGA 42 0 

CCAACAACTG TACTAGTATT ACTAAATAAT GAAATTTCAT TTTCTGACAA ACCACCCTCA 480 

GGaCCAAAAA TCATCAACAC TTTATCCTGA GCATTGAATT GTTGTAAAGT TTGCTTGAAA 540 

TTGCTTAACT CACCATCTTT TGCTTCCTCT TCATATGCAA TAAGAATATA GTCATAATTA 600 

TCAATAGTAT CACAAATTAA TTTTAAATTC GACTCGAATT GAATAGATGG AATCACTAAA 660 

CGATAGCTTT GTTCAGCAGC TTCTTTAATT ATTTTTTGCC AACGCTCTAT CTTTTTGGCA 720 

ACTTTTGCCT CGTTTAATTT AACAATTGAA CGTTCCATGC TCACAGCTAT AAATGATGAA 780 

GCACCCAATT CAGTAGCTTT TTGTAGCAAC CACTCATATT TGTCAGCTTT GATTAGTCCA 840 

CTGCAAATCG TAACATCAAC TGGCAATTCT GTATTAATAT TTTGTTTTTC TTTTAAATCA 900 

ACTTCAATTT TATCACTTGT TATGTCAGCA ATTTCACATA AATAAACTGT TTGATCATTA 960 

35 AAAGTTAAAA TAATTTTACT ACCAACATCA TATCTCATTA CATTTGTTAT ATGATGAATA 1020 

TCTTCTTTTT TTGTAATAAA AAAACGCTGA CTTACATCAG CGTTTTGGnT CTATGAAATA 1080 

ACGTFGCACA TTATTCACTC ACTTTCTGGC CAACAAGACA AACCCAACCG TTGT CATGTT 1140 

40 GTTCTGAAAT AATTTTAAAA CCTACACGCT CCATATGTGA CTGTATACCT TCATACTTCT 1200 

CTTTTATAAT ACCAGAAGTA ATAAAATAAC CGCCTTCATT TAGAGTATTA TAAGCATCTT 1260 

CAATCATTTC ATCAATAATA TGCGCTAAAA TATTTGCTAT TACAATATCA AATTTTTCTG 1320 

45 

TTTCGTCTTT CAATAAGTTA CCTGGAACAG CTTCAATTAA CGTTTCACAA TGATTTCTTC 1380 

TGAAGTTTTC TTTAGCTACA CTCACTGCCA TTTCATCAAT ATCCAACGCT TTAATACGTT 1440 

50 TTACACCGAT TAGATGACTT GCAATACTTA ATATACCTGA GCCAGTACCA ACATCAATTA 1500 

CTGAATGCTG TGGCAATACA TATGTTTCTA TTGCCTTCAA ACACATACTT GTAGTCGGAT 1560 

GATCACCTGT TCCAAAAGCC ATACCTGGGT CGAGCTCAAT GCAAAGCTCT TCATCCGCTT 1620 

55 



30 



969 



EP0 786 519 A2 



GGAAATAGTT TTTCCATTCA TTTTCCCAAT 

GAACGTTATG TTGATCAAGT TCATCTAAAT 

5 

ACTTATCATC ATAAOTCATT TCATTAAAAT 

AATCCTCTTT TTTCAAAQCG TAAATTTCAC 

CATCTGAATC TTCTATCACG ACACCATTTO 

10 

ATTCTACTGC TTCATGATTA ATAATAATTG 
CCTTAAAGAA TCTTTTTGCT CTATCTTTAA 
15 CATTTAATTG GGCAAATTCT TTCATTAGTT 

TTACTACTTT AATATCAACA TATAAATCTC 
CCTTTTCTTT TAAGCGGAAT TGCTTACCTO 

on . . 

CTTCATTATT TAATGTTGGT ATTTTTATTT 

CATTTAATTT GTAATAAATA TCATCACCAT 

TAAATACTAC GTATAAATCA CCAGCAGGTC 

25 

CTAATCTAAT TTGTTGTTCA TTGTCGACAC 
TTTTATTTTC AGTACCTTTT CCGTGACATG 
TTCCATTACA TTTAGGACAA ACTTGTTCAG 

30 

CTACAGCTAC ATGACCAGCG CGATTACAGT 
TTGCACGATC ACCATGACAT GTTTCGCATG 
35 TTGTACGAAA TACCGCTTCT TCAAATGTTA 

TTTGCGGTGC ATTTGGATCT CTTTGTCTGC 
CAAAgCCGCC GCCACCGAAG CCACTAAAAC 

40 

CACCAAAACC TTGTGGACCA TCATGTCCAA 
CACTTAAAAC TTCATAGGCT TCAGAAATTT 
TGTTAATATC TGGATGATAT TTTTTCGAAA 

45 

TTGAAGCATC CTTACTAATG CCTAAAACTT 
CTCCTTTTCT TAATTAACTC ATATAGTTTA 
SO GCCAAAGCCA ATGTTCTATT GACTTTGACT 

TGTTTAATTA TTTTTTGTCG TCGTCTTTTA 
TATCATTGTT TTGACCAGCA TTAGCACCTT 

55 



CCGTCTCTGC AATAATTTGC TCACTGAATT 1740 

TTAATAACTC ATCTTTAATT TGCTGTCGCA 1800 

AGGCTTTCAA TCTTACTCCC TTATCTGGAT 1860 

CGTATTTATC TTCTGGTTGG TTAATTAAAT 1920 

ATCCATGATT TTCAAGTATA TTGGTAGCCA 1980 

AAAGCTCTGT CCAGTTCATA CTTTATTCTC 2040 

AATTCGAAGG TTGTTCATTA ATTTCTTCAC 2100 

CTTTTTGTCT ATCTGTTAAT TTAGTAGGCG 2160 

CGTATCCATA GCCATGAACA TTTTTTATAC 2220 

TTTGTGTACC AGCAGGOATT GTTAACATAA 2280 

CATCG CCTAA AGCTGCTTGT GGGAAGCTAA 234 0 

CACGTTTAAA TGTTTCAGAT GGTTTAACTC 2400 

CTCCATTCAC GCCTGGAGAG CCTTCACCAG 24 60 

CTTCAGGTAC TTTCACTTCT AATTTAACTG 2520 

TTGGACAAGC TTCTTCAAAT TCTTGACCAC 2580 

TACGAACTCT ACCTAAAATT GTGTTTTGTT 2640 

AACTACAAGT CTTTTTACTT GTTCCAGGCT 2700 

TTACATCTTT ACGGATTGAA ATTTCTTTTG 2760 

ATGTCATTGT ATACTGAAGA TCATCACCTT 2820 

CGCCACCGAA GAAAGAGCTA AAGATATCTT 288 0 

CGCCAAAGTC AGAGCCATTG AATCCTTGTC 2 94 0 

ATTGATCATA GcTTGCGCGT TTATTATCAT 3000 

CTTTAAACTT TTCATCTGCA CCTTCTTCTT 3 060 

GCTTTCGATA CGCTTTTTTG ATTTCATCTT 3120 

CATAATAATC TCTTTTGGCC ACAGCTATCT 3180 

ACGTAATATG TCATACTATC CAAATAAAAA 3240 

TTTCAGATCA TGACAACATT CTAATTGTAT 3300 

CTTCTTTAAA TTCAGCATCT T CTACAGT AC 3360 

GTGCTTGTTG TTGCTGTTGA GCCGCTTGCT 3420 
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TATCTTCTAT ATCTTGACCT TCTAAAGCAG TTTTAAGAGC GTCTTTTTTC TCTTCAGCAG 3540 

ATTTTTTATC TTCTTCACCG ATATTTTCGC CTAAATCAGT TAAAGTTTTT TCAACTTGGA 3600 

5 

ATACTAGACT GTCAGCTTCG TTTCTTAAGT CTACTTCTTC ACGACGTTTT TTATCTGCTT 3660 

CAGCGTTAAC TTCAGCATCT TTTACCATAC GGTCGATTTC TTCGTCTGAT AATGAAGAAC 3720 

10 TTGATTGAAT TGTAATTCTT TGTTCTTTAT TTGTACCTAA GTCTTTTGCA GTTACATTTA 3780 

CAATACCGTT TTT AT CGAT A TCAAACGTTA CTTCAATTTG AGGTTTACCA CGTTCAGCTG 3840 

GTGGAATATC AGTCAATTGG AATCTACCAA GTGTTTTATT ATCCGCAGCC ATTGGACGTT 3900 

15 CACCTTGTAA TACGTGTACA TCTACTGATG GTTGATTATC TACTGCTGTT GAATAGATTT 3960 

GAGATTTAGA TGTAGGAATC GTAGTGTTAC GTTCAATTAA OGTATTCATA CGTCCACCTA 4020 

AAATTTCAAT ACCTAAAGAT AGTGGTGTTA CGTCTAATAA TACTACGTCT TTAACGTCAC 4080 

20 

CTGTGATAAC GCCACCTTGG ATTGCAGCTC CCATTGCCAC TACTTCGTCC GGGTTTACTC 4140 

CTTTGTTAGG CTCTTTACCG ATTTCTTTTT TGACAGCTTC TTGTACTGCT GGAATACGAG 4200 

TTGATCCACC AACTAAGATA ACTTCATCGA TATCTGAGTT TGTTAAGCCA GCGTCTTTCA 4260 

25 

TTGCTTGGCG TGTAGGTTCC ATTGTTCTTC TAATTAATGA ATCTGATAAT TCTTCAAATT 4320 

TAGAACGAGT TAAGTTTACT TCTAAGTGTA ATGGACCGTT TTCACCAGCT GAGATAAATG 4380 

30 GTAATGAGAT TTGAGTTTGT GATACACCTG ATAAGTCTTT TTTAGCTTTT TCAGCAGCAT 4440 

CTTTCAAACG TTGTAATGCC ATTTTATCTT GAGATAAGTC TACGCCATTT TCTTTTTTGA 4500 

ATTCTGCAAC TAGGTAGTCA ATAATTACTT GGTCAAAATC ATCACCGCCA AGTTTGTTGT 4560 

35 CACCGGCTGT TGATAGTACT TCGAATACAC CGTCACCTAA TT CT AGG AT A GATACGTGAA 4620 

ATGTACCGCC ACCTAAGTCA AAAACAAGAA CTTTTTCATC TTTATCAGTT TTGTCTAAAC 4680 

CATATGCTAA TGCTGCAGCT GTTGGTTCAT TAATGATACG CTCAACTTCT AAACCAGCAA 474 0 

40 

TTTTACCAGC ATCTTTAGTT GCTTGACGTT CAGCATCGTT AAAGTATGCA GGTACTGTAA 4800 

TTACAGCTTT GTCAACTTTC TCACCTAAaA TAgTTTCAGC TGTATTTTTT AAGTTTTGTA 4 860 

4S AAATCATAGC TGAGATTTCT TGTGGTGTGT ATGATTTACC TTCAATATCT ACTTTATAAT 4920 

CAGTACCCAT ATGACGTTTA ATAGATTGAA CAGTGTTTGG GTTTGTAATA GCTTGACGTT 4980 

TTGCTACTTC aCCAACTTGA GTTTCTCCAT TTTTGAAAGC TACAACAGAT GGTGTTGTAC 5040 

60 GTGAACcTTC AGGGTTTTGA ATTACTTTTG GCTCATCGCC TTCTAATAcT GTnACACATG 5100 

AATTTGTTGT ACCTAAGTCT ATACCAATAA TTTTACTCAT AATAAAATTC CTCCATTTAA 5160 

TCATTAAATT AATTTAATTT TAAACAATGT CTTTTCGCCA AATTTAAGTT ATTGGTTTAC 5220 

55 
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AGTGATTTCG CCAGATTCAA AATCAGGGTT ATCATCTTGA ACTACAGCTT GGTGAATATT 5340 

TGGATCAAAT GCTTCACCTT CAGTTTTAAT AACTTCAAGA CCATTATCTT TTAGTGCGTT 5400 

AATCAAACTT TCATGCACCA TTTGTACACC TTTTTGAAGA GATTTAAAAG TCTCATCATC 5460 

ACCTTCAATT TGAAGTGCAC GTTCTATATT GTCTATTGCT GGTAAAATAT CTGTTAACAC 5520 

ACGTTGTGCT TGATATGTTT TGTTTATTTC ATTTTCTTTT TGAATTCTAC GCTTATAATT 5580 

TTCAAACTCA GCGTAGAGCC TTAAATATTT CTCTTCGTTT TCATCTGCTA ATTGTTGAAG 5640 

TTCATTAATT TTTTGATCTT TTGGATCTAT TTCTTCAATA ACATTCTCGT CAGACGTTTC 5700 

15 TTCTATTGCT TCATCTTGTA AATGACCTTT ACTTTCTTCA GCTTGTTCAA CTGAATCATC 5760 

AATATTTTGT TTGACGTTTG TTTCTTCAAC TGTTGATTCA GTGTTTTTTT CAACTGATTC 5820 

GTCTTTATTT GTCATTTTCT GTCCTCCAAT ACTTTCTAAT CCATCATTAC CAAATTCTAT 5880 

TTAATAATTG AATGACATTT TGATAATGCA TAG CTGTAGG TCCAATCACA GCGATTTGAC 5940 

CTTTTAACGT TTCATCAAAA TGATATTGAC TTGTTACAAT TGAAATATCA CTTAAGCTGT 6000 

CATCAATTTC ATTACCAATT TTTACATTAA TATTTGGTGA AGATATATCT TGTAATAATT 6060 

CTGCAATTCT ATTTGATTCT ATATATTGTA GAATGGGCTG AATTGAAGAT ACATTAC TT T 6120 

CATTCAATGC ATCAATAAGT TTAACCTTTC CACCCATATA AATGCTATTA CTTTGATTAG 6180 

30 AAATATGATT ATTCATCGTA TTTAACAATT TATTGATAAA AATTTCTTCC TGCTCTGATT 624 0 

GAaCAAAAGA GACAATATCA TCTTGTAAAT TCTGATTAAA CTCAGTTAGT TTGTTTGTAA 63 00 

CAAAATTTGA TATTGTATTT AGTTTGTCAT TATTAA 6336 
<2) ^INFORMATION FOR SEQ ID NO; 220: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13059 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 



20 



25 



35 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 220: 

45 

TTCATGATTA TTATCTGTTG TAGACACTGC TGGATCTTCC GATGTATCTT TCGATGCATC 60 

TTTCGATTTG TGTATTTGCT GATTCAAATG GTCTAGGTCT TCTAACGCCT TATTTACCAT 120 

60 TG CTTCATCA TTTTTATCAT CTTTTTCTCC ATGTTTTGTT GTAGCCGTTT GTGACATATC 180 

ATTTTTCATT GCATTAAGAT CGTCCTCGCC ACTTTGTTGA CCCCTATCAA CATTTGAAGA 240 

AACCTCATTT AAATCTTTAA GCAATTGATC TAATTTACTG TCTATATCAC TTTGACCGTT 3 00 
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TTCATCTATT 


TGCGATGCTG 


TTTTCGCTTC 


ATTTAGTTGT 


GCTTTATAAT 


GTTCTTTAGA 


420 


6 


TGAAGCCGAT 


AACTGTTTTA 


ATTGCTCAAT 


TTGACGAATT 


GCCTTGTCAA 


CTTTGTCTAA 


480 




TAAATCTTGC 


TTAGATAATA 


TCTCTTTTGT 


AATTTCAGTA 


TCCTTTTCAG 


ATGCAGCTTG 


54 0 




GGCATCGTAC 


GGCAAGATAT 


TCGTTAAAAT 


GATACTTGTC 


GCCATCATTG 


TCGAACACGA 


600 


10 


TAACTTTACA 


TATAATTGAA 


ACGGTTTCCC 


TCGATATTTA 


GCCATCAACA 


TACTCCTTCC 


€60 




TCACTTACTT 


CCTTCAAAGA 


ATTACATACT 


ATTATATACC 


TGTTTACAAG 


AAATTTACAC 


720 




TTATCTATCT 


AGTTATTGTT 


GTTAGTAATT ATCTACTTAT 


TACTTAGCTT 


ATATTTAAGT 


780 


IS 


AAACAAAACA AGCATGACGT AATATCATAT TGTCCATGTC GCTAACATCA 


TATTACGTCA 


840 




AATCTTTTAT 


ATTAAATGAT 


GTTTTATTTT 


AGACTGCTTT 


TTCCTTTTAG 


CTTTCGAGCG 


900 


20 


CCTGTTTAAA 


AACTTGCTCG 


AATTGTTCAC 


GCGAGATTTC 


GTGTGCATGT 


GCTTTTTGTG 


960 


CTAATAAAGC 


ATCTCGAAAC 


TGTTGTTGAT 


CTTTCAAACT 


TTCTAACATT 


TGTATTAATT 


1020 




GGTCTTTACT 


TTCCATTGTT 


ATCTCATCAT 


TATGCTCAAA 


TAAGTGCTCT 


GATAATGTTA 


1080 


25 


CTTTAGCATG 


GTGTGCGGTT 


TGACGATAAC 


CTAAAATCAA 


CAACTCATAG 


TCAAACGCTT 


1140 




GTTCCACCGC 


ATTTAAAATT 


TCATTACCCT 


CATTGATATC 


AAGATAAATA 


TCACATAACT 


1200 




GGTATAGTTC 


ATTTACCCTG 


TCAATATTAA 


TAGATGGGTA 


TAAATGCACA 


TTAGCATATT 


1260 


30 


GATCAAGTTG 


CATTAGCTTA 


TCAGACATCT 


CTGTAATAGC AGCGATGTGn 


AACTTAAAAT 


1320 




CTGGTAAAGt 


TyCAACCAAT ACCTTGATGT TACGAatTGa 


TCCgAGTTAG 


TTAATATTAC 


1380 




AATTTCTTTA 


GTATATCTAT 


TACGACTACG 


ATAGTTATAT 


AGATATCCGC 


CTTGTAAAAT 


1440 


35 


ACGAGATTGA 


ACCTTTGCGT 


CTGCTATATT 


GAGCATCGTT TCATATTCGT TTTTATCTGG 


1500 




AATAATAATA 


TTACAATGTC 


GTTTCATATC 


ACCTTTACAC 


ATCAATTGCA 


TATTTCCCGG 


1560 


40 


GACATTACCA TTACAGTGTT CTTGCCATAC CAAAACATCA CTACCTTTTG ATGGCAAATT 


1620 




ATATAACACT 


GAAAATGGTA 


GGGCTAGTGA 


GTTAATAACG 


AAATGATGTT 


CCGTAATTTC 


16B0 




AAGTTGCTTG 


ATAAAAAATA 


ATGCGAATGC 


GAGCTTTGAA 


GGGAAAAAGT 


AAGACTTCCC 


1740 


45 


TTGCCAATCC 


AATATGACAT 


CAGATGTTAC 


AAAATTTTCA 


TAAATCACTT 


CTTTACCTTC 


1800 




TGCTGTCATA 


TATTTCTTCA 


AGATCGCTTT 


ACGATTTAAA 


TCGTAAACAG 


TTTGTGCAAA 


1860 




TTTAATACCA 


TTCTTAGAAT 


AATAATCGAC 


AAATCGGACA 


CGTTGTTGGT 


CATCAAACCA 


1920 


SO 


TTCGACACGA CTAACAATTC TAGGGCGCTC TCCACTTTGA yAAAATATTT TACCTCGyAG 


1980 




ACGTCCCATA 


TCATTaATTG 


TAGCCGAATT 


GTTGTTACCT 


TTAATTTCCC 


AAAAAGCTGG 


2040 




TACAGTAACC 


TGATTAAAAA 


ATCGTGGTTT 


CATATTTTCT 


GTATTATGAT 


TATCTGCAAA 


2100 



55 
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TAAATCTTCT 


TCCAACTTAC 


TGGCTTTAAA 


AGACTCATAT 


AACTTTCGTG 


AATGATCGTT 


2220 


5 


AAAGTAATCA AATAATTTAA 


TCATGTAGCA 


CCTCTTGaAC 


TAATGTTTCC 


CATTTTAAAA 


2280 




TAATATCTTG AGTCATAAAT 


TGCTGTGCCA 


CTTCATAAGA 


GATGTCATGT 


GGTGTCTGGG 


2340 




GACCATTGTT AAAATACATT 


ACAATGGcAT 


GAGCTAGTTT 


TGCGATAACA 


TCATCCACAC 


2400 


10 


TATCTTCGTC 


GGTATCAAAA 


GGTACCAAGT 


AGCCATTTTC 


CCCATCTCGA 


ATAAAGGTTG 


2460 




GGTTACCATA 


ATTCACATTT 


AATCCAATCA 


TACCTAGTCC 


TGAGCCTACC 


GCTTCCATTA 


2520 




GTGTTAACCC 


AAAACCTTCG 


CTAGTTGATG 


CAGAAAGAAA 


TAACTCATAA 


TCATTATAAA 


2580 


15 


TTTCATCAAG 


TTTAACATGC 


CCTAGTAAAC 


GAATATAATC 


TTGTGCGCGG 


TGTGTATCAA 


2640 




TAATTTTACG 


CAGTCGCGTC 


TTCTCGCTAC 


CTTCTCCATA 


AATATCAAAT 


GTTAATTCTG 


2700 


20 


GCACTTGTCG 


TTTAGCCACG 


ATAACCGCTT 


TGACAAGCCA 


ATCAATATGT 


TTCTCATTCG 


2760 


CTAAACGAGA 


TGCACTAATC 


ATCGCATATG 


GCTTTCTTGA TAATGTTGGA TATGATAATG 


2820 




CATCAATGCT 


TCCCACAGGA 


ATAGTATAAA 


CACGTGGGCG 


ATAACCTTGA 


TATTGCTCAA 


2880 


25 


ATTGTCGACA 


AACCATATGA 


TTTTGAATAT 


CTGTTGCTGT 


AATAAAGAAA 


TCAATGTATT 


2940 




TAGCTTTTGA 


AAATTGATAT 


TCATAATAAT 


TGTTCCATAG 


TATATGCTGC 


TCACTCATCA 


3000 




TATTATTACT 


ATAATGATCA 


GCATGAATCA 


CAACACCAAC 


TTTACTATCA 


CCTTTATGCT 


3060 


30 


GCAAAAGAGC 


CTGACCAATA 


TCAGAAGCGC 


GGTCTAATAT 


GACAATATCG 


TCTCGGGTTA 


3120 




AATTCAATCG 


TTGTAAAAAG 


TATGCAATAA 


ATTCCGTTTT 


GTTATACAAC 


ACCGCATCTT 


3180 




CAAACAGATA 


TATAGAGCTG 


TCTCCATCAA 


TATATTCGTT 


AT AAG CGATG 


GAACCATCTT 


3240 


35 


GATTATAAAA 


TTGTCGCATA 


TATAATTTCG 


CTTTATTATC 


AGCTGGTGCA 


TAATACTCAG 


3300 




AAAATATGCG 


CGTATAACTA 


TAAAAATCTT 


TACGTACTAA 


CATACTATTA 


ATTACAAATT 


3360 


40 


CTGCACGATC 


CACAATATCT 


TTTTGTTCAT 


TTTGCAGATA 


ACATGTTACA 


AATGATGATT 


3420 


TCCCATTAAA 


ATATAGGCGG 


ACTATCTTAC 


CATTTCTTTC 


TCTAAAACTA 


ATGTCATGAC 


3480 




CAAGCTCACG 


TTCAATGTCA 


TCTAACGTGT 


ACGTTGTTGG 


TGCTAAAGAA 


ATATCACTAA 


3540 


45 


AATACTGATA 


CAACCAAATA 


ACTTCTTGAT 


CTTTAAACCC 


AATGTTTTGC 


GTTAATGTCT 


3600 




GTATGTTCTC 


TGACTGTATA 


AAATCTAAAA 


ACACAAATTT 


AGTGTCTTGA 


TTTGTACGTC 


3660 




TCAATAATTT 


AGCACGGTAA 


GCTTGTGCAT 


ATTCAACACC 


GCTACTCGCC 


CAGCCTATAC 


3720 


50 


CAAAGTTTAT 


ATTATATATT 


GTCATGCGCT 


ACCCCTTTTC 


ATTTATGGAA 


AATGTATAAC 


3780 




TGGCATACCC 


TCTTTATCAA 


ATGTAATCAT 


GCTTTGACAA 


ATATTTTTCA 


CCATTCTTTT 


3840 




TTTGATATTT 


CGTGTCATAA 


CTTCAAATGA 


ATCTAAGGCA 


ACTCTATGGT 


ATTCAAAAAT 


3900 



65 
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is 



20 



35 



40 



4S 



SO 



65 



GACTTGTTCT AACCAACATG AATCAATTGC TTTCAAAAAG ACTTTTTGAA CGAAAATATT 4020 

ATAATAATAT GCACTTTGCA TGTTTTTACG ATTCAAAGCT AATTGCTTTT CAAATTGCTC 4060 

TAATAAAAAT GTCACTACTG CTTGCTTATC TTTAAAATTA ACACAAGCCA CATCTTTATT 4140 

AAATTGGAAA CTTAAATTTT GATAAATATA CTCGACAACA CGCGATTTTG TTAGCACCTT 4200 

TTCCTCATTT ACAAACATTT CAAATACATC TTTAGCTAAC GCTTTAAAAT CTTGATTCTC 4260 

AGCATCATCT ATTTCTAAAA CTCGATTGCG TTCCTCGTAT ACAAGATCTC GCTGTATACT 4320 

AATGCTTTTT TCAAATTCAT TAGCCATTTC ACGAGCTTTA ACCCCTTGTT CTTCCGAGAt 4380 

aCGcTGOGCT TTAACTACAA TTTGCTTAAC TTTGCGATTA AACAAATTAC TTTGCGATAA 4440 

TCGTTGTGCA TCTAATGAAT ATAATTGATT ATTTTCCGCT AAATTACTAT CGCTCCATCG 4500 

CTTAACTAAA TAATCATCTA GTGAAATATA TATACAAGAT GATCCCGGAT CCCCTTGTCT 4560 

ACCAGAACGA CCACGTAATT GCCTGTCTAC ACGGCTATTT TCCATATGTT CATGAATAAT 4620 

AACAGCTAAT CCACCTAATG CTTCGACACC TTCACCAAGT TTAATATCTG TGCCTCGACC 4680 

TGCCATACTA GTCGCAACAG TCATGGAACC AATTTGCCCT GCTTCAGCTA TCATCTGCGC 4740 

TTCTTTTGCA ACATTTTGCG CAATGAGTAA ATTATTAGGA ATATCCATTT GGAATAATAC 4 800 

TTTCGAAAAG TATTCAGCCG CTTCAGCAGT TCTCGTTATG AGTAAAACCG GTCGCCCCGT 4 860 

TTCATGAAGT T CAACTAT AT CATGAATCAT CGCGATGTTT TTCTCATCAA CTGAACGAAA 4 920 

CACTTTATCT GGTTCATCGA TACGTTGAAT CGCTTTATCA GTTGGTACTT GTACGACTAT 4 980 

TTTTGAATAC AAATCAAAGA ACTCTGATTC GCCTAATTTT CCTGTAGCTG TCATACCTGA 5040 

AAATGATTCA AAAAGTTTAA ATAAATTCTG GAAGGTAATT GTTGCCATAA CACTTTTATC 5100 

TGTTGAAACC TCCATACCTT CTTTCGCTTC AATAGCTTGG TGAAGTCCAG CTTGCAACTT 5160 

AGTTCCCGGT AACATACGAC CTGTAATACG GTCAATTAAA ACAATATCAC CATTATATAC 5220 

AAAGTAATCG ACATTAGATT CAAACAAATA TTGTGCGCGC AGTGCTAAAT TAATATTACG .5280 

CACTAGGACC ATCGCTTGTT CGCTATATAA ATCTTCAACA TTAAAGTATG ATTGTGCCGC 5340 

TTCAATACCT TGATTTAACA GCCATATTTC TTTTTTGGTC TTCTTCATTT TAAAATGCAC 5400 

GTCTTCAATC AATGTATCTA CAAACTCTTT CACAATATGA AATAGATTTG ATTGTAATCT 5460 

TGGTGCACCC GAAATAACTA ATGGTGTTTG AGCAGCATCT AAAATGATTG AATCCACTTC 5520 

ATCAATAATA CCGTAATTTA ATTGTGGTAA AAATTTCCCT TCCGCACTAT CAGCCAAATT 5580 

ATCAATTAAA TAATCAAAAC CGAGACGTCC ATTAGTTGTA TATATAATAT CATGTTCATA 5640 

TATATTACGT TTTTCCCCTT TTTGATACTC ATAATCCACA ATATCAACAA AACCTAATGA 5700 
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TAATCATTCG TTGTAATTAA ATATGTTCCT 
ATCGTTGCCG TTAATGTTTT ACCTTCGCCT 

5 

AATACAATCG CTCCGATTAA CTOAACTTCT 
GCTTCACGTG CCACTGCATA AGCTTCAGGT 
GCTAAACGTT CTTTAAATTC TATTGTCTTT 

10 

ACTTCATCGC TCCATGTATT GaTGsGTTcA 
CGTTTATCGT AACATCTAGT TTATGTTTCA 
15 TCTAAGTAAT CTAAAAATCG TACTGGATTC 

TCTTGCTCTT CTTTAAAATA AACCTCGACA 
ACATGTTCTG TAAGCCATCC TTTTAAATCA 
20 CAACCCAAAT GCTGAGCGAC ATAAGTTGCA 

AAATTAATAG CCTTTAGGGT ATCTTGACTT 
CCCTCGATAT TGTCGTCCAT CCAACGTTCA 

25 

AAATCATTCG AAATAGTTGG ATAGGTGTCA 
TCATTTCCAT ATTGGTCATC GCCTATCTTC 
TATTGATGCG TCATCTCTGT GATTGTTAAA 

30 

TTCATCATTT TTATTTTATA AGCATAGGCk 
GACTTTACAA TCTCAGTACT TAGTTTTGTG 

3S TACACTGAAC CAGCAGGCGT TGCATCAAAA 

CGCAAAATTG GkAAACTTGG CGcACTTTTA 
TCATGAATCG GTAATCCAGA GGG CATCAAA 

40 AATGATACTT TAGAGCCATA CATAAATGTA 

AATGTTTTGT TTTTCAGCAT GTTGAACTCT 
AAAATTAACA AACCAACTTG CAATGGTAGG 

45 

GCGATTCATC ACTCTTGCTT GGTGTGCTGT 
TGGATCATAA TCATCATGTT GGATATATGC 
CTTTTGAAAT GTTTGCCAAA ATTTTTGATT 

60 

ACCTTCATTA GACACCAGGA CGTCTAATGC 
CATATGTTCA GCAATCGTTC CAATATTAAC 
55 



TTTCCCGAAA GAGCATTTAA ATATAAAGGC 5820 
GTTTGCATCT CCGCAATGTT ACCTTCATGC 5880 
TTAGGATACA TACCTAATAC TCTCCAGCTC 5940 
AACAATGTAT CTAGTGTATC AACTCCTGAT 6000 
TGTTTTAACO CATCATCAGA ATATGATTTA 6060 
CTATTTTTCT AATCGACTTT AGTCTTAATT 6120 

TTTACTTCCC CACCATTCAG TTTCGATACA 6180 

ATTAAACGTG ACATATAATT TAGATGTTTG 6240 

TTTGTATCTT TTAGTTCATG ATTTCCTGGG 63 00 

TCATCTTCAT GGCTTGTACG ATACACTTTG 6360 

AAAACATTTG ACTTTGACCC ATAACTAATC 6420 

TGCAAATCAT TCTTTAGTTG CTTAATATTT 6480 

ACGAGCCAAA CATGACCAAA CAGTTTCAAA 6540 

GATGGTTCTG CAATAATGAC ATTGATCATA 6600 

GTCACCCGCA TGCTTTTATA CTCTAAATCA 6660 

CATCTAAATA TAAGACTCGT CGATGCTGCA 6720 

TCATCAGGAT ATTGAATCGT AATACTATTT 6780 

CCATTTTTAT TATAAAAAAT GATGATAAAA 6840 

TCAAAATGCA ATTTATAATG CTGTCCTCTA 6900 

TATTTTGAAA ATTGCTTTAA CATCAACCAC 6960 

GGATTTATAA AAGTCACTTC ACCATTTGAA 7020 

GTTTGTGAAA TATAATTCCA AGTAACTTTA 7080 

CCCAAACTTG TCTTCCAAAA TAATGTTGTA 7140 

TGAATCATCA TTATGTCGCC CAGGAATACT 7200 

CAATACAGGT AATAGCTCTT GAAATGCATG 7260 

TATGGCAAAA ACAGTTTGTG ACAATGATTy 7320 

TAATGCCTGT ATCGACGCTT GAGATGTATC 73 80 

TGTACCGAAC TCTTCTGGTC TAAGTAATCG 744 0 

AAGTGGTTTA CCAACAATAA TTGCCTGAGG 7500 
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TAATTCATGT GATTTAAAAT TCAGCTTTTC TAATGTCTCG TCAATAACAT TGATAATACC 7620 

TTGTTCATAT TCAGATGAAC CGATATAAAA ACTACCACCT TCAACACGAG GATCGCCGAT 7680 

s 

AAGTAAAAAC G6TGCATTCA TACGTTTCAT CATATAATAT CCTTCGAAAC CTTCCGCTGT 7740 

TCGATAACCA CTAAAATATA CGTTTAGTGG CGGTTTCATA TCACCAGGGT GGAAATAATA 7800 

AATAAATTCC TGTCGTTGAC TATCTACGAA ACGACTACCA CCAAGTAAAA ATTGACCCAT 7860 

10 

GTCTAATCTA GACCATOGTT TGTGTATAGG TCCTAAATGT ACCGTCCCGT TCCCACGCGC 7920 

CTTAACAGTT ACACTTATAT AAGCATCAAA TGGTTTCGCA GGTATCTCTA AAGGACTGTC 7980 

1S TAACATATCA TCAGTCAATA CGATTTGTTC AATTAATGCA CCATCAGCGC CAGTCTGAAT 8040 

CAATCTAAAT GTATATTGCA ACTCGACCGC ACCATCAATA TCAAATTCTG GCCATATTTG 8100 

AATGACTTTA TCTTTATOGT AAACGAGATT ATTTTGCCAA GATGCGATAG GTTTAAATTC 8160 

20 TTTCCCAAAT TCTCCACTCA ATGTGAGCTC TGAATTACCT TGGTAAACGA CATCTGCTTT 8220 

AAAATTCGGA TGCACAAGTG CTAACTTAGG AGAAACCTTA TCTCCATACT GTCCTGAGAA 8280 

GCTAACTGCC TCTAATTTAT TATTACGTTC TTCAATATTC CGGTAATGTA ATGGTTGAAC 8340 

25 

AACGTATTTT TGGACATTTT CGTCTTGTTC ATATTCAACT GACCAAAATG ATTCATCAAC 8400 

ATACGTATTG TATGGTTCGC TTATCATTTG TAATAAATTC GTTAATGTCT CCGAGTATGG 8460 

TGCTTGAATA TAGATAAAAT CAAAGCGCCC TTCTGCTTCA ACAATCGCTT CAATAG CCTC 8520 

30 

TACATAACCA CTATCAAATT CAAACAATCC AATATCGAAG TAATC CCAAC TCACACCTTT 8580 

TTTGTGTTGA AAAATAGGTT CTAAATCGTC TCCTCCAATT TGCAAAACTC TAAATTTACG 8640 

35 TGGCATCATT TTCACCTTCT ATTAACTCAT CGAGCTGATT AATAATATTC TTAGAAGCAT 8700 

ATGCATCTAT TAATTTTAAA GAATAGGCGT ACGCATAATT CCAATTTTTC AAATAAAATA 8760 

AATAATAATT TAACG CATCA TCTAATTCAT CAACTGTATT TATAATACGG CCATTGTCAT 8820 

40 AATCAGAGAC GTAATCTGTT TGTTGACCAT TAATTTGTGG AATCCCAGCG CTAATTGCAC 8880 

TAATTTGTAA ATACAAGTCA GGTTCTTTTG ACATATCTAT CACAAGTCGC AAOGTCCGCA 8940 

ATGCTTCTAC AACATCATGT TCAGCATGTA TCGTCTTAAC AGCAATGATG TCATCTTGAT 9000 

45 

CTTCAGGTGT CATTAATGCT GAAACATTAA CATCCGCATT CTGTTTAGCT TGGTATTCCT 9060 

CATTTACCGA CGTAATACAT TCACGAAGCC ACATCGGTAT GTCATTTTGA TGGCGCGATA 9120 

ATAAAATTAA ACGGTAATAA TCTTCCTGTG CGATATAATC CACAAGTCGT TGCATCATTT 9180 

50 

GTTGCAAATC AGCGTCACTC ATACCATCTA TCCATACACC TATAAATGTT TCCATCAATT 9240 

GACTACTTAT ATTAGGTGAT TGTCTCGTTT CAAATGGTGT GATTCGAATC ATTGTATTCT 9300 

55 
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TTAAATGGGC ATTCTTTACG ATAGATTGAT 
TTTTAAAAAA TGAATAACTT AATGATTTCG 
5 GCCTAGCATC TGAAGCCACA ATCACATGAT 

CTTGAAATTT TTCTTCAATT AGTTGAGCCA 
GTTGATATCT TTTTGAAACA GTGACTCTGC 

10 

CTCCATTAAT CGTTAAATAT TCTTGGTAAG 
TCG CTGATAA ATAACCTCTG TCATCAAAAA 

1S ATTCTTCAAA CCAAATTGAA TACCCTTCTT 

CACTCGTCAC ACATTTTAAT AAATACGGTG 
TTAAGTGATG ATAATTAATC GCTTGTGGCG 

20 ACACAGACGA ATACTTTGTC TCATATAAGT 

GTGCATGATT GAGAACAATC AGTTGATAAT 
AACTAATCAT ATCGTCAAAT TCCGTCTTAT 

25 CTTGCCACGA TCGTTGGTCA TCGTACCAAG 

TACCAATACT GGTTTAAAAA TGGCTTATAT 
TCTGCAATAT TAATACTGAT GTAAACTAAT 

30 

GTAGATAAAT GCGGTACAAA CAATGTGAAA 
AATGGGAATC CAAACCAACA TACGCGTCGT 
TTACCAGGTT TaACTCCTGA AAAATAATTG 

35 

TTAGTATTGA TTAAAAATCT CGATAAAAAA 
ACTGAAATAC CTACTGGACT ATCAAATGTC 

40 TTAAACATAG ATAAAATAAA ATGAATGCCA 

ATCATTAAAG TAATACTGCC TGCAGGGTTA 
GTTGCGGAAA CGTTCATTAA ATCGATATAT 

45 AATAAGATAA ACAATGTGAT TATCACAAGG 

GCATCTATAT ATTCCATTTT TTGATGCATC 
GGCATTGGTC CTGCGATGCC GTAGCGACTA 

50 

GTTCCAGTAA CCAAAATCAA TATTGTTAAG 
GAAACATATT CATGAATCAC AAAATAACTT 

55 



ATTCCTCATC TGACACAGTT TCATTTCTAT 9420 

CTGGAATATG ATTGGCTATT TGTCGATTGT 9480 

CATCTTCATG TATTTGTTGT GCAATCATTG 9540 

TATTGTTATA TTCTGTTTGT TGATAGTGAT 9600 

CATTTTTCAA ATCTTCATGA AGTACACAAT 9660 

AAGCCTCTCC CTGATCATCA AAATAACGTA 9720 

TATAACGCCG TTGTAACTGA TCTCTTTCAA 9780 

GACTAAAATA AATATTTGTA TAGGTCTGTT 9840 

TGTACACAAA CTCAACATCA TCCGGCCATT 9900 

CATGGTGACT GAATCCTTGA ATTTCATCAA 9960 

CATATCGATG TAAAAATGTT CTTAAATTTG 10020 

CTAAGTCATT TTCAAGGTGC ATTCCCATTA 10080 

TTTGTAGTTG ATAATACGGC ACAGTCGTGT 10140 

CTGGAATAAA GTATTTCATA ATTACCTCCT 10200 

TTATCAAAAT ATAAATATGT ACGAATTGTT 10260 

ACAATCAGTT GTACTGAGaA ATAAATTTCA 10320 

TAAAGCGGTA TACCAATAAT GACTGTAACT 103 80 

GCTTGATAAT TTAAATAACG TTCTGTATCC 10440 

CCACTCTTTA AGAAATCTTT GGATTTTTGT 10500 

TAACCCAATA ACATTTGAAT CACTAAATAT 10560 

AGCATTGGCA TGTCATCTGA TATGCTTTTA 10620 

CTTTTTAAGA AAACAAAAGC TG AAAT ACT C 10660 

ACTTTCCAAG ATAAATAAGA TTTCATATTT 10740 

GGTATTCTCA CTTCTACTAA TTCAATAAAT 10800 

ATGATTAACA ACGCAATCAC AATATGACTT 10860 

ATTGATTTAA TAATACTAAC CATTACAATC 10920 

TTTTTGTCAG CTAACCAAAC TAATAACATC 10980 

TAAATATTGT CTTGATGAAC ACGTTCTTTC 1104 0 

TGAATAACAC TTAAAATTAA TGTTAAGATG 11100 
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GAAATCAGCA 


TCAAGATAAT 


CATTGATYjiTT 






arpiYsaaaaTT! 


t 4 <VAh 

1X220 




TTTAAAGTAT 


TAACGTCTCC 


ACCCATATTA 


GAAATAGCTA 


xxx xn/vwww\ 


x va/%Vv x v^r% lui 


1 t o a f\ 

ix^aO 


5 


TTTACTTGCA 


TATCGTTaTA 


GGAAACGATG 


U1VW\ X VJ X X X w 


THPfTA 1TAT 
x V7V~ w x nn X A X 


ATAAATA aAf 


XX340 




AAGATAAAAC 


ATGTGTATAG 


CATACGTTTA 


TATATAATTT 


TATATTCGTA 


TTGTTGTAAA 


11400 


10 




TGTTGCACCT 




'WvUvV^rVX xa 


a a a aoapta a 


X X \JJ% lwi 


11460 


CTAATTATTA 


AAATCCTATA 


" ( *f^f*Z 71 TTTHTP 


T 71 TV2 71 THYif* 




X"X Tl'i'AAi A i 


11520 




TAGCCAGCTA 


T A & ITTrAlT 
iMAAi iV>nnl 


^P^PTA ^P^^^^^ff^ff^^ TA 

X X Ai v»V» 1 1\m% 


r* 71 JAff'TAfV'fT 
VxAAiLAlLl 1 


GATCATTTTC 


ATCTTTCTTT 


11580 


15 




XvAi XA/VAVC 


T" TA TA TA O/^ TV 7» /T* 


ft 7A*P7V TV nviffiAK 

AATAATGTCA 


rp TV TV /"V"» /■'/*'' TV 

TAACGCCACC 


TAGTAATCCA 


11640 




All lul X X 1 A 


I IXsAva X V-ACC 


TGTATCTGGC 


AATu"~X~X~X~X~X~x 


CACTTTGTGC 


TGGTGTGCCA 


11700 




TTATGTTTAG 


TCACTTCAGA 


XTji i\jCACTT 


AATGTAGACT 


GAGATTCACT 


CGTGCTCGTT 


11760 


20 


GTTGCTTCAC 


TTGATAAGCG 


AGATGTGCTC 


GTGCTGTGAG 


TATGATGCAT 


ACTCATTGAG 


11820 




TCTGACGGAT 


GCATTGAGTT 


AGATTCAGAT 


GTACTTGTTG 


AGCCGGACAT 


ACTTGTTGAT 


11880 




GTTGAGTCAG 


AAATGCTTTG 


TGAACCAGAC 


ATAGATGTAC 


TCAGTGATTC 


GGATGTGCTT 


11940 


25 


GTCGAATCGG ATGTGCTCAA 


TGACGTTGAT 


GTGCTTGTTG 


ACACTGATTC 


TGAGTCACTA 


12000 




ATTGATGTTG 


AGTCGGATTT 


GTCTTGTGAC 


ATTGAAACAC 


TCGATGAATT 


AGATTCACTC 


12060 


30 


ATTGATGTTG 


AGTCAGATAC 


GCTCGTTGAA 


CCTGAACCAG 


ACGTACTTAA 


TGATTCAGAT 


12120 


ATGCTTGTTG 


AAGTTGAACC 


ACTTGTTGAG 


TCCGATGTAC 


TTGTCGATGT 


CGAGTCTGAA 


12180 




TCTGATGTAC 


TCAATGATTC 


TGAGTCACTG 


ATAGAAGTTG 


AATCACTTGT 


AGATTCTGAT 


12240 


35 


TCTACTGTAC 


TTTGTGAACC 


ACTGATACTT 


Ax 1GAAGTAG . 


'TV TV ^P^flV. / 41 IV * TV m 

AATCACTGAT . 


ACTGTCTGAT 


12300 




GTTGATAATG 


ATGTCGACAC 


CGATGTGCTT 


TGTGATGACG 


ATGTACTAG C 


ACTCATTGAC 


12360 




ATTGATGTTG 


ATATCGATGT 


AV. 1 lAAbuAA 


/"•/^i » /"* RIV^TA /"* 
V^VjAViA. 1\3VJAV_ 


TTGTACTTGT 


TGACTGGCTT 


12420 


AO 


TGTGACATTG 


AATCACTTAA 


*TY3 aiY*2T 71 d at* 
XuAXvj X AvJtAX 


GTGCTTGTTG 




ACTTACACTT 


12480 




GTTGAACCTG 


ATATTGAGTC 


7A TA^T 1 ! 1 


X V-VxrvX UllU 


AAAPTYSAi- u»r» 
nnnL lu/iU W V» 


uC 1 1 v^vA^C X C 


12540 




ATTGAGTCAG 


ATGTTGAAAG 




tfi lUAni X xv 


A X LWil* X\jc/i x 




X2o0U 


45 


TCACTTGTAG 


ACATTGAGTC 


GCTTTCTGAT 


GCACTGATGC 


TCATAGAGTC 


AAATTGACTA 


12660 




TTACTTGTTG 


AGCTTGACTG 


CGAATCGCTC 


ACACTTGTTG 


ACGTTGATTC 


TGATCCACTC 


12720 


SO 


ATACTTTGCG 


AGCTACTCAA 


TGATTTTGAA 


TCACTTAATG 


AATCCGAAGT 


GCTAAGACTT 


127B0 


GTGGAACCAC 


TTAAAGATAT 


TGATCCACTT 


AATGAGTCGG 


AGTCACTTGT 


ACTAGTAGAA 


12840 




TCACTCATTG 


ATATTGAATC 


ACTTAGcGAG 


GTAGACTyGc 


tTACGCTTTC 


TGAACCACTT 


12900 



55 
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TTTGAATCAC TTAATGAATC AOATTCACTC ACGCTTTCTG AACTTCTTAG TQACOTCGAT 13020 

ACACTTAATG ATGACGAATC GCTTGTGCTT ACTGAATCG 13059 

5 (2) INFORMATION FOR SEQ ID NO: 221: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10758 base pairs 
<B) TYPE: nucleic acid 
10 <C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 221: 



20 



25 



30 



35 



40 



45 



50 



AGGGATGGCC 


TTACCTAAAA 


AACCGGGnAA 


ACCCTCCAAA ACCCATTAAA 


AGGnTGGnTA 


60 


CCCTTTAAAA 


TGGTAGCATT 


TAACCGCCAC 


CCGCCAAGGT 


GGGTGGTTTA 


TTCTTC CGTT 


120 


ATTTAAATTA 


GTACACCATG 


CAGATTCTGT 


AGTTGAGGGA 


TATTTTAACG 


AAAGCTTATT 


180 


AGCAACTGAT 


AAAAAAATAC 


GTCCTAAGGC 


AT AT ATTG CT 


TCATGGAAGG 


ACATCGAGCC 


240 


GGCTAAGAAA 


ATAGAATTTA 


AAATTAAAAA 


AGGTATTAAA 


TGGCATGATG 


GTAATGAATT 


300 


GAAAATTGAT 


GATTGGATTT 


ATTCAATTGA 


AGTCTTAGCT 


AACAAGGACT 


ACGAAGGTGC 


360 


TTATTATCCA 


AGTGTAGAAA 


ATATCCAAGG 


TGCGAAAGAT 


TATCATGAAG 


GAAAAACTGA 


420 


TCATATTAGC 


GGATTGAAGA 


AAATAGATGA 


CTACACTATG 


CAGGTTACAT 


TTGATAAAAA 


480 


ACAAGAAAAT 


TACTTAACAG 


GATTTATTAC 


TGGACCTTTA 


TTAAGTAAAA 


AATATTTATC 


540 


AGATGTACCA 


ATTAAAGATT 


TAGCGAAATC 


AGATAAAATC. 


CGAAAATATC 


CTATTGGTAT 


600 


TGGACCGTAT 


AAAGTTAAGA 


AAATCGTTCC 


AGGTGAGGCT 


GTTCAACTCG 


TTAAATTTGA 


660 


TGATTATTGG 


CAAGGTAAGC 


CTGCACTAGA 


CAAAATCAAT 


TTAAAAGTTA 


TTGATCAAGC 


720 


GCAAATTATT 


AAGGCAATGG 


AAAAAGGCGA 


TATTGATGTT 


GCGAATGATG 


CTACCGGTGC 


780 


AATGGCAAAA 


GATGCTAAGT 


CATCTAATGC 


TGGTCTCAAG 


GTATTATCTG 


CGCCAAGCTT 


840 


AGACTACGGT 


TTAATAGGtT 


CGTATCTCAT 


GATTACGATA 


AAAAAGCTAA 


TAAAACTGGT 


900 


AAAGTGAGAC 


CAAAATATGA 


AGACAAAGAA 


TTACGTAAAG 


CAATGCTTTA 


TGCAATTGAT 


960 


AGAGAAaAAT 


GGATCAAAGC 


GTTTTTCAAT 


GGTTACGCTA 


GTGAAATCaA 


TAGTTTTGTA 


1020 


CCATCTATGC 


ATTGGATAGC 


AGCCAATCCT 


AAGGACCTAA 


ATGATTACAA 


ATATGATCCT 


1080 


GAAAAAGCTA 


AAAAAATCTT 


AGATAAGTTA 


GGTTATAAAG 


ATAGAGATGG 


TGACGGATTT 


1140 


AGAGAAGATC 


CTAAAGGTAA 


TAAATTTGAG 


ATTAACTTTA 


AACATAATTC 


AGGTTCTAAT 


1200 


CCTACTTTTG 


AACCAAGAAC 


TGCTGCGATA 


AAAGATTTCT 


GGGAAAAAGT 


TGGCTTGAAA 


1260 
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AATACGATTC 


■ CTGTTTATAT 


GCCATATATC 


ACATCTTATT 


TCATGACGCG 


TGCTATCGGC 


1380 




GACAGACCTT TAGTCGTCCC 


GCATCAATCT 


CAGAACTTAG 


CATTTATTGG 


TAACTTTGCA 


1440 


5 


GAAACAGAGC 


GAGACACTGT 


ATTTACAACA 


GAATATTCGG 


TTCGTACTGC 


CATGGAAGCT 


1500 




GTTTATCAAT 


TACTAAATAT 


AGATCGTGGT 


ATTCCAGAAG 


TCATCAATAG 


TCCATTTGAT 


1560 


10 


CTTCGCOTCT 


TAATGGATGC 


CATATACGAA 


CTGAATGACC ACCAAGATTT 


GCGTGAGATT 


1620 


ACTAAAGATT 


CGAAAATGCA 


AAAACTCGCA 


TTAGCAGGAT 


TCCTTAAAAA 


GATAAAAGGT 


1680 




ACGTACATTG 


AGTCATTATT 


AAAAGAACAC 


AAATTGTTAT 


AACGAAAACC 


ATTAATAGAT 


1740 


1 f 

19 


TTTTATTTGG 


TGATTTCAAA 


TCATGAGACT 


GGGACAGAAA 


TGATGTTTTC 


ATAAAAATTA 


1800 




TTTCGTTGTT 


CCACTCTCAT 


GATTTTTTTG 


ATGAAACATA 


ATTACATGAT 


TGATTGCATC 


1860 




ATTTTGTTAA 


ACAAGTGATT 


GCAAACCTGC 


CATTTCACAC 


TGAAAATTTA 


CATAATAAGT 


1920 


20 


GACGATATTT 


TACAAGTCAT 


ATACAAATAA 


CATATATTGT 


TAAATAATTT 


TACCTAATCT 


1980 




TAACATTAAA 


TTTACAATTA 


TAAGCGATAA 


TCTAAATATA 


AAGCTTATTT 


GAGGTGAAAT 


2040 




AATGGAAATG 


TCGGTTACAG 


AAGTCATTTT 


ctccttttta 


GGTGGTTTAG 


GTATTTTCCT 


2100 


25 


TTACGGCTTA 


AAAATCATGG 


GAGACGGGCT 


TCAAGCATCA 


GCAGGAGACA 


GGCTACGAGA 


2160 




TATTTTAAAC 


AAATTTACAT 


CAAATCCAGT 


ATTAGGTGTT 


ATTGCAGGTA 


TCGTTGTAAC 


2220 


30 


TATTTTAATA 


CAAAGTAGTT 


CAGGTACGAC 


AGTTATCACA 


ATCGGACTGG 


TAACAGCTGG 


2280 


ATTTATGACA 


TTGAAACAAG 


CCATTGGAGT 


GATAATGGGT 


GCTAATATCG 


GAACAACGGT 


2340 




AACTGCATTT 


ATTATCGGTA 


TAGATTTAGG 


CGAATATGCA 


ATGCCAATTT . 


TAGCATTAGG 


2400 


35 


TGCATTCTTA 


ATCTTTTTCT 


TTAAACGCTC 


TAAAATCAAT 


AACATTGGCC 


GCATACTATT 


2460 




CGGTTTOGGT 


TCACTATTCT 


TCGGTCTAGA 


ATTTATGGGT 


GATGCCGTTA 


AACCTTTAGC 


2520 




ATCATTAGAT 


GGATTTAAGC 


AATTAATGCT 


TGATATGTCT 


ACAAATCCAA 


TACTCGCTGT 


2580 


AO 


CATTGTCGGC 


GCAGGGTTAA 


CAG CACTAGT 


TCAAAGTTCA 


AGTGCGACGA 


TTGGTATTTT 


2640 




ACAAGAATTT 


TATCAACAAG 


ATTTAATTAG 


CTTAAACGCA 


GCAATCCCTG 


TGTTACTAGG 


2700 




CGATAACATT 


GGTACCACGA 


TTACAG CTAT 


CTTAGCTAGT 


TTAGCCGGCT 


CAATCGCTGC 


2760 


45 


AAAACGTGCG 


GCGCTTGTAC 


ACGTCATCTT 


TAACTTAATC 


GGGGTAATTA 


TCTTCACAAT 


4m O \J 




TTTCTTGCCA 


GTTGTGATTC 


ATTTGATTAG 


TTTGTTACAA 


GATTTATGGC 


ACTTAAAACC 


2880 


50 


AGCGATGACG 


ATTGCAGTAT 


CACATGGTAT 


CTTCAACATA 


ACAAATACTT 


TGATTCAATT 


2940 


ACCATTTGTA 


GCAGGTTTAG 


CATGGATTGT 


TACAAAGCTT GTCCCAGGTA AAGATATTGC 


3000 




TGATGACTAT 


AAACCTCAGC 


ACTTAAACAA 


AGATCTTGTT 


TATCACGCAC 


CTGGTGTTGC 


3060 



55 
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AGACATTCGC GAAATTACAA AAGACOATAA 
TCAAGCTGTT GAAACAATCA ATGAT AG CAT 
5 AGCCATTACG AAGGCAGACG TTGAGCGTTT 

TTTAAAAGTA GCAGAGCTAA CAGAAGAGTA 
AGATATTCGC ATTACAGAAG ATGCACAACG 

10 

TGAGTCATTT GATAAAGCCA TCGACATGTT 
AATTGTAGAA CGTAGTAGAG AATCATTTAA 

r5 TAAACGCCTT AATCGTGGTG AATGTACAAC 

TGGTGTTCTT GAACGTATCG GTTATCATTC 
TAACGATGAT GTACCTACAG ATGAAGAAAT 

20 TTATTTATAT TCATATTTTT TTAAAATTAG 

ACATTCATGG GTTGGCTTTT TTGTTTAGCA 
CTGATATAAT AATGCTTCAT TAGTATGCGG 

25 GACCCCGAAA CGTTTAATAT ACACTTTTAC 

ACCTTCACAT TATATATAGT TCTTTCCATA 
AAATAAC CAT CCACCTAACT TATCAAAAAT 

30 

ATTTATATTA GTGTTAATCC AATCATAGAT 
TCATTTAATT TGCTTTACTT TCATTTATAT 

3S ATTATTTCGC ATCTTTGACA CGTTTATCAT 

ATGCCATGAT TCCCATTAAT ACGTTAACCC 
TCGTTGCAGC AACTGCACCA GCATATACAG 

40 CAAGTGATGA AGCCATTTTA TAAATAC CTG 

TCGAAATAGC TGTATCTGTA GAAGGTGTTG 
AATATCCTAC GACACAACTG ATAACATAAA 

45 

GTGCAATACC AATGACCACA ATGAATGTAC 
TTTGTAATAA TTTTTCACCA ACTCGAATCA 
ATAAGTATCC TGCCTGCAAT G CTGTATAAC 

SO 

CAATTAATGT ACCTGCAAAA CCGTTTAATA 
GTTTATTTTC AAATAATTTA AAATCAATAA 

55 



AAAATTGATC AAAAAGCTTG AACAAAAGCA 3100 

TCGAAATTAT TTAGTTAGAA TTTCTACAAA 3240 

AGCAGTTATG TTTGATGTCA ATCGCTCTAT 3300 

TGTCGCTCAA TTAAAACGCC AACATGATGA 3360 

CGGTATGGAT AAATTATTCA ACCATGTTGC 3420 

AGATGTTTAT GACAAAACGA AAAAAGATGA 34 80 

TATTGAACAT AAACTACGCA AAGGTCATAT 3540 

AAAAGGCGGA TTACTATATA TCGATATOAT 3600 

ACGAAATGTT TCTGAAGCAC TTGTTGGCCT 3660 

TGCAACAACT GAAATTTAAT TTTTACTGTC 3720 

AGATTCAGAT GCATGTAAAA AGCCAATCCA 3780 

AAATTTATTA TCTTAAATCG GCTATAAACA 3B40 

TAAGCATGAC GGACACTGTT CTCGGAGTCT 3 900 

ACGTCGCCTT CATTGAAGCG AATTG C CAT A 3 960 

TAAATGTCCA AATTTTTAGA ACAACGCAAT 4 020 

TTAAGTGGAT GGTTTTTCAT TTTCATTTAT 4 080 

TTATCTATAT GCACTGCTCT ATACATTTCC 414 0 

CATTATCAAA ACACTTGGCG TGTCATCGTT 4200 

CATTAGGAAT CGCGAATAAA ATTGOGATAA 426 0 

AAAGTGCAAT CATCGCACCT GTATGAATGC 4320 

CACCACTAAT TGCGACACCG AATGCGCCAC 43 80 

AAGCAACGCC AACTTTATCT AACGGTGCAT 4 44 0 

CATAAATACC TAAGC CTAGT CCGAAACATA 4 500 

ATATGCCTGG TAAGAATACT AATGAAATAA 4560 

CTAATAACAT TGGTCGCTTA GAACCCATTT 4620 

TCAATAACAC CATGATTAAA TAAGTAATTG 4680 

CTAAACCTTG TTGCACGAAT GTATTCGCTA 474 0 

AGAAGTTCGA AATCGTTGCA CCTGTATATG 4 800 

GTGGATTATC TACTTTTTTC TCAACATTTA 4 860 
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10 



is 



20 



25 



30 



35 



40 



45 



50 



AACCAAGTGC 
CAATTAGCCC 
TCCCTTTGAT 
TCCAACCCAT 
AAGAACCGAT 
TCATAATGGC 
CTAAAATTAA 
ATAATAAACC 
CAACAACAAA 
TGTCTGTACC 
ACCAAAATGT 
TTTCATTCAT 
6CAGAAATAA 
TCACCATTTT 
TATGCAAAGT 
GCTTCTTTCA 
TAATCATCGT 
AAACGTTTAA 
CCTTCAATTT 
ATTGTGACAA 
GTGACGAAGT 
CCACCTTTAC 
CTGTAATACA 
ACACCGTCTA 
GCTGGTTGAT 
TCTGCTAATA 
TTATTTTGTG 
GCACGGATTG 
GGTCCGACAT 



TGCACCTTTA 
TGCAACGTCA 
GAGTAACATT 
AGTTGTCGCA 
AGACCAATAA 
CAATGTAGAA 
TAATGCCGGT 
GATATTCGTC 
CATGCCTGAA 
AAAACTTTGT 
AATAACACCT 
GTTAGTTATC 
GTAATGATTT 
CCACCGCTGC 
CTTCTGAAGG 
ACGTCTTAGC 
TATATTCTAA 
TTTCTTTTTC 
CAACAACATC 
CACCGGTTTC 
AGCTACCTGC 
CTTGAACTTT 
CTTTACCTGT 
ATACACCATT 
GTATCACAAC 
CAAGCATGTA 
ATGCAAAAGA 
CTAATGTTTT 
TCGTTTCTAC 



GTAATGACAA 
AATTTATGTG 
GAAAGTACGG 
ACTGCACCAC 
CTTAAGGCAC 
GGCATAATAC 
AAATTCGTAA 
ATTTTCACGC 
AATAGTGCAG 
TGTAAATTCG 
AATACAATAC 
TCCTTTAAGG 
TTCTGAAATG 
ACCTGTATAA 
TGGTTGTGGT 
CACGTACTCA 
GGTGCAAGTt 
AATTGTTGCT 
TTTAATGACA 
AAATGGACTT 
AACAATCGCA 
CAATTTGAAG 
TTTCATTGTG 
TTCAATCATT 
GACTTTTCCT 
TGCTGTATGT 
TAATCCTGTA 
ACCAGGTTTC 
TTCCACATCT 



CGTTTAAACT 
TATTGGTAAT 
CAACGATAAT 
CGAAGAGTGA 
GCTGACGTTC 
ACGCTGCTGA 
TAATAATTAA 
GCCCAATTTT 
TTAGACTGAC 
GTACAACATT 
CTAAGATTAA 
TAATCTAAAA 
TTAAATTTAG 
ATAAAGGCAC 
TCACACATTT 
GTAAACTCTG 
ACACCATACA 
TTTGTAG CAT 
TTGAATTGAC 
AGTCGTCTAG 
TCATTGGCCA 
AATGCGCGTC 
CTCATGACGT 
GTTTTAGCAC 
GTAAAACTAT 
GCATCGTGAC 
TCTTCAGTAA 
CCTGAATCAA 
TTACCTTTGT 



TAGCAACATA 
TTCTGATTTC 
TGAGAAGATG 
ACAGATACCA 
AGCACCCTGA 
TACACCTTGT 
TGCTGAACCA 
ATCTGCCAGA 
CGCAATACTA 
TACAAGTGAT 
CTTGTTGCCC 
CAACTGTCCC 
GATGATGATG 
TTGGGCGTTC 
CAACACCAAA 
GATCATTATA 
TATCCTCTAA 
CTGTTAATCC- 
CTTTACCGTC 
ATACAACTGT 
TATGTGGTGA 
CTGTTTGAAC 
GTACAC CTAA 
CACCTGGTGG 
CTTTCATTTC 
CACATGCGTG 
TGGGTAATGC 
TCGTTACTTT 
AAAATTGAGC 



ACTACTAGAA 

GTTTCAGGCG 

AAAATCCATC 

CTGCCACCCC 

TAATAAGTTT 

ATAACACGAC 

ATAATACTTA 

CCACCTGCTC 

ATTGTCCCCA 

TGTGCAAACA 

CCGCGATACG 

TACTGCTTCT 

TGGGTAAATT 

TTTAGCATAA 

ATCAAGGTTT 

TAATGCTGGA 

TCCTTTTGAT 

ACGTACATCA 

AAATGAACCG 

TTGTAACGCT 

TGAACCATGA 

ATAACCAGGT 

TACATGATCA 

TACTTCTTCA 

AGCAAGCGTC 

CATAACACCT 

GTCAAAGTCT 

AATTCCACGT 

GATGTATTTC 



4980 

5040 

5100 

5X60 

5220 

5280 

5340 

5400 

5460 

5520 

5560 

5640 

5700 

5760 

5820 

5880 

5940 

6000 

6060 

6120 

6180 

6240 

6300 

6360 

6420 

6480 

6540 

6600 

6660 
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ATCATTTTGC CTTCTTTAGA TTTTAAAGTT 

TCCTTAGTTA CATCATAAAT GATTAATCAT 

5 

CCATTAATTT TTTGCAATTT TAGCTTTOAA 

ATTTGTOATT TGTGATCATT TTATGAACTT 

CCATTCGTAA TCATTTTAAT GTTTAATGCC 

10 

TCTAATTTCG GAAAACTCAT TCGATTAACG 
ATCGTATGAT GTTTGCGCCA AAGATTAAAT 

75 TGTTTAATCT TATACATACC TTCTTCCAGG 
GCACGCATAT TCATTTGATT GTCCAACGCT 
AACAATATTT GAAAATTTGA ATCAGTCCCC 

20 ATATTGCTTG TTAATTTATT AAATAGCAAT 
TATTGATGAA ATAGTTCAAT AGAATTCATA 
TGCAAATCAT AATTCAACCA ATACCCGATA 

25 

TGCTCAATGA TGATACCACC TCTAAAATAT 
AATGTATTCC AATTGAGTAA AATGAGTGGA 
ATAAGGTAAT TCGTTTTATT AATAATCATT 

30 

ATTTTATTAA AAT CAACAGC GTCATTTGAA 
GGCTCAAGTC GTTTCAATAA TGGTAGATGT 

35 AAGCGACCAT TAGGGAATAA TGCTTTAAAA 

AATGTCGTCA CATACAAGTT GAACTTCAAA 
TGATGGATAA AAATTTTAAA TGCATCGATA 

40 ATGGTCAAAC TAAAGTTATG ATCTAATAAA 
ATATTCGAAA TTTCTGCATC ATACGTGAAT 
ATCACATCAT ATGCTAATAC TTCATTGACT 

45 

GATTGATACT GTGTATTGAG CAAATTCCTC 
TGATTTAGTT GGTGATTGGT TGGTTGAAAG 
TCTTCAATAA AATGATTCAT TTCTTCAATG 

50 

TCGTGATAAT CATGTTGTGC CGATTGCTGG 
TATTGTTTAG GTGTTTGATG CGTAAAGTGT 

55 



TCAATTAATT 


GTTGATTCAT 


ATCCTTCATC 


6780 


TATTTATATT 


GCCAACAACA 


GAGATGTTAA 


6840 


TATAAAAAAT 


CACAAATTAT 


GTATATCAAA 


6900 


GGGTAACGTT 


TTACTTCAAT 


TAAGTGAATC 


6960 


AGTGTGTCCG 


TGATATCTAT 


ATCATATACT 


7020 


TAATCTATAG 


AGTCCTTGTC 


CATGCCATGT 


7080 


AACGCACCAT 


TTTCTTTATC 


TAAGGTAAAA 


7140 


GCATTAATGT 


TCAAATGAAT 


CATTTCCGTC 


7200 


AAGTACGGAT 


TAAAATGCTT 


TGCATCATAT 


7260 


GTGACAATAC 


ATGTATCATC 


AGAATACAAA 


7320 


GCCGTGAAAT 


AGACCGGACG 


TTTTCCATTA 


7380 


TAATCCCGTT 


CATTTTTACA 


ATGACTGACG 


7440 


CCCTCTACTT 


TAGAACTTAA 


TTTTAATAAT 


7500 


TCGCCGTTTG 


TAATAAATGT 


ATCACCCGTC 


7560 


CGCTTTAGGC 


GATGACGATG 


CATTAAGTCG 


7S20 


TGACTCG CGG 


TTTTAAATTC 


ATCATCATTC 


7680 


TTGGCATCAA 


ATACAAAATG 


GTCGATGTGT 


7740 


CTTTCCGTAG 


CTTGATCTAA 


GTGAATGTAC 


7800 


TAATCAATCA 


TTTCAATCAA 


AGACGTGTGC 


7B60 


TCTTTTCTAT 


GACTGACATG 


CAGGGCAACG 


7920 


TAATCACGTG 


AGTCATACTG 


ATCCAAATGC 


7980 


AAGTCTAAAC 


ACAAATCAAT 


ATCATAAAAT 


8040 


GGCGCATTGA 


gctttttcat 


GATATATGGA 


8100 


TGAAAATCAT 


GATGACATGT 


AAGCAACTGT 


8160 


AAATAGCCCA 


CTTGAATAAT 


ATGATTAAAT 


8220 


GCAATCTCTT 


TATAGTTCAT 


CTTTTCAATA 


8280 


TAGTCATTTA 


AAAGTAATAT 


CAATTCACGG 


8340 


TTTTCAGTGA 


TTGCTGGACG 


ATCACCTCGA 


8400 


TTAAATGTTC 


TOGCAAAGCT 


CGCTGCACTT 


B460 
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TTCGCATGCT CAATTCGCGT CGTATTTAAG 

OTAAACTTTT TAGACAGATG GCTCTCTGAC 

5 

CTTAAATCTT CATQAAAATG TAACTCQATA 

TTTAAGATAC TTTGGTTCGA ATGATATGTA 

AACTGAATCA CAAGTTGTTG CTCAGTCAAT 

10 

GAAACCAGTC TTGCCATTAT ATTTCTCAGT 
GTTAAGTGAA AATATAGACA ATGCACATCA 

1S AATTGGATAT AACATATGAT GCCATCTTGT 
TTAATGATGA AAATGTCGCC ACTGTTGCAT 
GCCTCnCCTT TAATAACAAA ACCAATCATT 

20 CTCTCAGTTT CTACTCGAAT TAAATAATCA 
TGAATACGTT TATTTTACAT TATTTTACAG 

TGTGTGGATG ATTATTTATC CTCACTCGGT 

25 

TTTTCACCTT TTTTCTCCAC AAAAGTAAAT 

TTTAAGTCTC CCgAACCTTT CaACaATAAC 

CTTTTTCGTA ATTGTTTTAC ATTATAGTCA 

30 

CTCGGTACCT CTGGATTATA TGATATATCG 
CTGCCATATT GCGCGAAGAA CTTAAAATTC 

3S ATACCTTTAG TTGGAATGAT TTTATTGTCT 
CTCTTAGGTC TACCATCTTC ATCATGAAGT 
GTCTTAGTGT TTCTATTCAT ATATAGAACC 

40 GGTTGAACAA CCATTTCAGA ACCAATAATC 
TCATCACGAT AACCTTCTTT ATCGTATAAA 
AATGTTTTTT CAAAGCTTTT CTTAACTTCC 

45 

AAACTAATGA CTAATATCAA AAAACTAATA 
ATTTCACAAT CCTATTCTTC TTATTATCTT 
CATGATTATT TATCCTCACT TGGTTTAAAA 

SO 

TCTTTTTTCT CTACAAACGT AAATTCAATG 
TTCCCTGTAC CyTTCAACAA CArCTTCGGy 

55 



AAATOATGGA ATCCTACACC 


TAG CviA 1 1\* Ti 


8580 


CACCCAACGT 


ATTCGCTTAA 


A iCTGAAAGG 


8640 


TAGTCGCATA 


CTTGATTCAC 


TTTATCATCA 


8700 


CGCGGGACAT 


AATGAATCAT 


ATGCATAAGC 


8760 


TTAGACAACT 


CATTATGTCG 


GATATGTGTT 


8820 


TGATGTATAT 


TCTTTGTTGT 


GGTCGCATCT 


8880 


TCAAACTTGT 


CTGCTAAATA 


TTTCATTTGG 


8940 


TGAAGTTGAA ATCGATACAA GTCGCGGTGG 


9000 


TGCGTGATAT 


TATTTTCATC 


ATAAATGTGT 


9060 


AAACTATTGA 


GCCTTTTGAA 


ATCTGACATA 


9120 


CGTTGCATAC 


TATCCCTCAA 


TTCAGTAATA 


9180 


CAACATATTT 


GAATTTCATA 


TTGAATCGTG 


9240 


TCAAGATGTA 


GACTATCAGT 


AAAAAAAGTA 


9300 


TCAATGTCTT 


TATATCCAAC 


TGrTGaACCT 


9360 


TTXGGXGCTT • 


TATTCGTTGG 


TATTTTATAT 


9420 


a w<l InUl In 


ATTGATATTT 


TGCTGAATAA 


9480 


CCGTCTTTGT 


ACTTOGACAA 


ATCTTTAAAG 


9540 


TCGATTTCTT 


TTTTTATATT 


TTCGTCTTTG 


9600 


ACCATTTTAA 


CGGGATATTC 


TTTATCTTTA 


9660 


GTTTCACTCA 


CTATATACTT 


cccGcm-rA 


9720 


ATACCTTTTG 


ATTTCATACG 


TTCCCCTTTA 


9780 


CATGTACCTT 


TATCATTTTT 


ATCAAATTCG 


9840 


TCCTCTAGAT 


TTTTAATCGG 


ATACATACTC 


9900 


GCTTCTTTAC 


CTATGCCACA ACCAGCAGTG 


9960 


TACAATACCA 


ATTTGTTTAA 


TCGTTTCATA 


10020 


TCCTGGATTG 


ATTTCATATT 


TTGATCGAGT 


10080 


ATTAACCCAT 


CACTAAAGTA AATGTTCTCT 


10140 


TCTTTATATC 


CAACTGATGA 


ACCTTTTAAA 


10200 


GCTTTATTTG 


TTGGTATGTC 


ATATCTTTTA 


10260 



985 
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10 



1S 



20 



ACCTCTGGAT TATATGATAT ATCTCCATCT TTATAATTCA TTAAATCTTT AAAATTGCTA 10380 

TATTGCGCAA AAAACTTAAA GTTTTCGATT TCTTTTTTTA TGTtTTCTTC TTTAACTTCC 10440 

TCAGTAGAAA TGAATTTATT ATTAATCATT TTAACTGGAT ATTTTTTTTG ATTATCCTGA 10500 

GCTACTTCGT ATTTCTCCGT CTTTAtTTCA TTAGTATAGT AAAAtCCTTT TGCACTTCTT 10560 

GTATTTCTAT CTATCTTCAA AAGCATGCCT TTTATTTTTA GAGCTTCTCC TTTATTTTGA 10620 

ATTGCCATTT GAGAATTTAC AATCCATGTT CCCTTATCAT TTTTATCAAA TTGATCATCA 10680 

CGATATCCTT CTTTATCGTA TAAATCCTCT AGATTTTTAA TCGGATACAT ACTCAATGTT 10740 

TTTTCAAAAC TTTTCTTT 10758 
(2) INFORMATION FOR SEQ ID NO: 222: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1109 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



2S 



35 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 222: 
nTaTCaACTT TGGaATTTAA AgTCAATAAC TTTTTTAAAA ACTTTTTQTG TTCACAACCC 60 

GCTTCTTTTT CAACGCGTTT ATTGCTTAAC ACAAGAACTT ATTTTACCAG CATTCCAAAA 120 

CAAATCAACA TAAAAACGTA CAAAATAAAA GTAATTTTGT ACGTTTAGCA TATATTATAC 180 

CTATtTATTT GTAGCAGCTA TAACTTTTTG TGCAATCGAG CTATAAATTT TACCTAGACG 24 0 

ATCATCTGAT TGATATATTG ACGGTGCAAA ATCTTTTGGA TTCCAAGATG GTTGCTCTAA 3 00 

AGGTAATTCC CCAAGTAATT GAGTATTAAG TTCATCAGCT AACTTAGTAC CGCCACCTTT 360 

GCCAAAGACA TATTCTTTAT TACCCGTCTC TTTACTTTCA AAATAACTCA TGTTTTCAAT 420 

TACGCCAAGA ATAGAATGAT CCGTATGTTT TGCCATCGCA CCTGCGCGAg CTGCAACAAA 4 80 

TGCTGCTGTA GGATGAGGTG TCGTTACAAT AATTTCCTTA CTTGAAGGTA ACATCGTATG 54 0 

AACATCTAAA GCTACATCTC CTGTTCCAGG TGGAAGATCG AGTATTAAAT ATTCAATGTC 600 

TCCCCATTTA ACTTCTGTAA AGAAATTCGT CAACATTTTA CCTAACATTG GCCCTCTCCA 660 

TATAACTGGC GCATTTTCTT CCACAAAAAA GGCCATTGAT ATAACTTTAA CGCCATGACG 720 

TTCAACTGGA ATTACTTCCT TCCCTTTAAT TCCAGGCTTT TCATCAATAC CCATCATATC 78 0 

TGGTACACTA AATCCATATA TATCGGCATC TACTAATCCG ACTTTTTTCC CTTCACGAGC 84 0 

TAAGGCAACG GCTAAATTTA CTGCAACAGT AGATTTACCG ACACCACCTT TACCGGAGGC 900 



55 



986 
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ATTTTCTTCT TTTGGTTTAA ATTGATTTAC TTTTTCTTCC GGCAATGTTT CAAATCG TAT 1020 

ACCGACCGTT TTCGCACCGT TTTCTTTTAA TGCATTAACA ACAGCCATCT GTAAATCTAA 1080 

aTTGCGtGCA CCACCTAATT GTGCCATTG 1109 



(2) INFORMATION FOR SEQ ID NO: 223: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 3997 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 223: 





TCTTTATTTA 


AAAAAATGAT 


TGTCTAGTTT 


GTATCTCTCT 


GAAGATTTGG 


CAATAAATAA 


60 


20 


AAGCCGATAA 


CCGTATAATG 


ATTATCGACT 


TAAAGTTTAT 


GTGGCATTTT 


TTACTTTTGT 


120 




AATTTCAGGT 


GAGTTAGATG 


ATTATTATCA 


GATAGATTAT 


TGCTTATAAT 


CATATGATGT 


180 




TTGAATGATA 


TCTTTGATTT 


CACTGATTAG 


TGCTTCTTTA 


GGATTAGCAG 


TTGTACATTG 


240 


25 


ATCTTCAAAT 


GCGAGCTCTG 


CCATTCTATC 


AATTGACTCA 


TTTAATTCTT 


CTTCAGACAC 


300 




ACCTTGTGAT 


TTCAAATTCA 


TTTCAATTCC 


GACTGATTGA 


CCTAATTCGT AGACAGCTTT 


360 


30 


AgCTAATGAT 


TCTACGAGTG 


CTTCTGTCGT 


ATTACCTTTT 


AATCCTAAGA ATTTGGCAAT 


420 


ATCTGCATAA 


TCTGTATCTG 


CTCTGAAGAA 


CTCATATTTA 


GGGAATAATG 


CATGTTTTTG 


480 




CGGGTCTTTG 


GCATTATAAC 


GGATAATATG 


CGGTAGTAAT 


ATOGCATTCG 


- CTCTACCATG 


S40 


35 


CGGAATACCA 


TATTCGCCAC 


CAATTTTATG 


CGCAATTGAG 


TGTGCAATGC 


CTAAGAATGC 


600 




ATTTGCAAAT 


GCCATACCAG 


CCAAAGTTGA 


TGCGTTATGC 


ATTTTCTCTC 


TTGAAACTTT 


660 




atcaCccttt 


TCAACAGATG 


ATTTTAAATA 


TTCGAACGTC 


AATTTAATCG 


CTTGTAGACT 


720 


40 


CAAACCTCTT 


GTGTAGTCTG 


AAGCCATTAC 


AGATACATAT 


GATTCCATTG 


CATGCGTTAG 


780 




TACATCCATT 


CCTGTATCTG 


CTGTAACGCT 


TTTTGGCACA 


CTCATCACAA 


ATTGAGGGTC 


840 




AATAATTGCA 


ACGTCAGGTG 


TTAAAGCAAA 


ATCAGCCAAC 


GGATATTTTA 


CATTTGTTTC 


900 


45 


ACTATCTGTG 


ATAACTGCAA 


ATGGTGTTAC 


TTCTGAACCT 


GTACCTGATG 


TCGTAGGGAT 


960 




ACAAATGAAC 


GTCGCATTTT 


CAGGCATGCC 


TATTTTATAA 


GTACGTTTAC 


CGATGTCTAG 


1020 


50 


GAACTTTTGT 


TTAGCACCGA 


AGAATGATGT 


CTCAGGGTGT 


TCAAAGAACA 


TCCACATTGC 


1080 


TTTTGCAGCA 


TCCATCGCTG 


AACCACCACC 


AAGTGCAATG 


ATTGTATCCG 


GTTGGAAATC 


1140 




AACCATCATT 


TCCAGACCTT 


TATATACTGT 


ATTAGTTGAT 


GGGTTCGGTT 


CGACTTCGCT 


1200 



55 
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ATAACCGAAT TCTACCATAC CAGGGTCACA GACAATCATC ACTTTTTCAA TCTTGTCCAT 1320 

TGTTGTTAGA CTCATGATTG CATTTTCTTC AAAATAAATT TGAGCAGGCA CCTTGAAAAT 13 80 

TTGAGTATTA TTACGTCGTT TAGCAATCGT TTTAATGTTT AATAAATCTG TCGCACTAAC 1440 

ATTATGTGAA ATTGAGTTTC TACCGTAGaA CCACAACCTA ATGTTAAAGA CGG AATCAAT 1500 

TCGTTATACA TATCACCAAT ACCTCCAACC GCTGATGGTG TATTTACAAG TACACGACAA 1560 

GCTTTCATTC TTAGTCCAAA ATCTTTTTGT AATGTTTCAT CTTCTGTATG GATAACGGCT 1620 

GTGTGTCCTA ATCCACCAAA ATGTAGTGTG TCTTCACAAA TTTGAAATGC TTGTTTTGTA 1680 

;5 GATTGGGCTT TTACTAAGGC TAATACTGGA GATAATTTTT CACGAGATAA CGGATAGTCT 1740 

GAACCTACAC CGCTAATTTC GGCTATGATA AGTTTTGTAT TTTCGGGGAC AGGTATACCT 1800 

GCTAATTCAG CTATTTCAAC TGCAGATTTA CCGACAATAT CAGGCTTAAT ACCTGTTTTT 1860 

20 TGTTCATTCA TAATTGCATT TTCTAAGCGT TGTAATTCAT CTTTTTTAAC AAAGTATGCT 1920 

TGATGTGCTT TAAATTCATT AGTAACATCT TTATAAATTT CTTTATCAAT GACTACAACT 1980 

TGTTCAGAAG CACAAATCAT ACCATTATCA AATGTTTTTG AACCAATGAT ATCATTTACT 2040 

GCACGTTTAA TGTGTGCTGT TTTTTCAATG TAAGACGGCA CGTTACCTGG TCCCACACCT 2100 

AATGCCGGTT TGCCAGTTGA ATATGCAGAC TTAACCATGC CCGAACCACC TGTTGCTAGA 2160 

ACTAATGCAA TACCTTTGTG ATTCATTAAT TGTTTTGTTG CTTCGATAGA AGGCACTTCA 2220 

ATCCACTGAA TAATATCTTT AGGTGCACCT GCCTTCATTG CCGCTTCTAA TACAACTTCT 2280 

GCTGCACGCT TCGACGATTC TTGTGCACTT GGATGGAATG CAAAAATGAT TGGATTTCCT 234 0 

GTCTTAATTG CAATCATCGC TTTAAAAATA GTTGTCGACG TAGGATTTGT TGTTGGCGTA 24 00 

ACACCACAAA TAACACCAAT TGGTTCCGCT ACATACGTTA ATCCTTTTTC TTTATCTTCA 2460 

CCAATAATCC CTACTGTCTT ATTGTCTTTT ATTGAATTCC ATATATATTC AGAAGCGTAT 2520 

AAATTTTTAA TCGCTTTATC TTCGTATATA CCTCTTCCAG TTTCTTCATG TGCTAATTTT 258 0 

GCTAGCACCA TATGTTGATC AACAGCTGCT AAGCTCaTTT GATGAACAAT ATGATCAATT 264 0 

TCTTCTTGTG ACTTTTTAGA TAATGCTTCT AATGCTTTTT TCCCTTTGTC AGCTAGAGCA 2700 

TCAATCATAA TTGCCACTTC TTGTTCTTTC GATCCACGAT TTTCTTTTTC AGG T AT AGTT 2760 

AACATATACA ACCACTCCTT TATACTTTGT GAATTATTTC ACAAACATTA TAG TACATGT 2820 

CTCTCAGGAT ATAAAGAAAA TTCTATA CAA AAAAGTTTAA TTTCGAATAT TATTTGAACA 2880 

AATATCAAAT TTTAAAATAA ATGTTTTCAT GAAATCATTG TTATTTCGGT GTTTTTAGAA 2940 

TGATTTTATA ATCATAATTT TTTCAATGAC ATAATTTATT CATAATTATA TATTTAATTC 3 000 



45 



SO 



SS 
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10 



15 



20 



25 



30 



35 



TCCTTGTCGA TACCTATCAA CAGATGTTAC AAATAAAAAC CaCCCGTOTG AACGGGTGGT 
TTGTTCTGCG gCTATAAGCC TTCCTTACTG GCCaGCCCTA AAAGGGCACT GACAAGTCAG 
CCAACTGCAC TACTATTCCA GCAATCCTAA AGGTTTACTC T TriTTCTTT CTTTTTTTAT 
TTTTCTCTCC AGTGAAAGGA TCTAAATATT CTTCCATTGA AATTTCATCT GCAACGATAT 
CCTCTTGTAA TTGATTACGA ATATAATTTT CAATCACTTT TTTATTTCTA CCTACTGTAT 
CCACATAAAA TCCTTTACAC CAAAACTTTC TATTTCCATA TCTATACTTT AAGTTAGGAT 
GTCTATCAAA TATCATTAAA TTACTTTTCC TTTTAAATAG CCAACAAATG ATGATACCCC 
AAGTTTGGGT GGTATACTTA CTAACATATG GATATGATCT TTACATACCT CTGCTTCAAT 
TATCTCTACA CCTTTTCTTT CATATAATTG ACGTAATATA ATCCCTATAT CTTTTTTTAT 
TTTTCCATAT ATCGCTTGTC TTCTGTATTT AGGTGCAAAG ACAATATGTT ACTTACAATT 
CCATTTCGTA TGTGCTAAAC TGTTTGTGTC AGATGACATT AAATAGCATC TCCTOGTGTT 
GATTATTTTG GTTGGCTOAC CAATATTTAC TCTAACATGT AGAGATGCAT TTTTTTGACA 
ATGGTAGAAC CTTTTCTGGG GAGTGGGACA GAAATGATAT TTTCGCAAAA TTTATTTCGC 
CGTCCCACCC CAACTTGCAT TGTCTGTAGA AATTGGGAAT CCAATTTCTC TTTGTTGGGG 
CCCCGCCCCA ACTCGCATTG CCTGTAGAAT TTCTTTTCGA AATTCTCTGT GTTGGGGCCC 
CTGACTaGAA TTGAAAAAAG CTTaTTaCAA GCGCATT 
(2) INFORMATION FOR SEQ ID NO: 224: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1391 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

3997 



40 



45 



50 



[XX) SEQUENCE DESCRIPTION: SEQ ID NO: 224: 

GnGCGAGACA AACACACtTA TTGGTGCCAT TATmCcTAGA ATGaATTCaT ATGCAGTAGA 60 

TGAaaCAATC AAAGGATTGG CAAAACAATG CCAAAAATAT GAATCaCAAT TAATTTTAAA 120 

TTACACAGGT TTAAATATCG AAGCAGAAAT ACAAGCGCTT GAAACATTAG CACGCaGTAA 180 

AGTAGATGGT ATTGTTTTAA TGGCTACAGA CATAACAGAG AGACATATTG AAGTCATTAA 240 

TAAAATGAAT GTACCAATCG TTATTGTTGG TCAACAACAT GAACAACTTC ATAGTATTGT 300 

GCATGATGAT TATAAAGCAG GTCAAATTAT AGGCGAATGG ATTGGTCAAC AGGGATATCA 360 

ACAAGTTGAA GTGTTTAGTG TAAGTGAAAA AGATATTGCA GTTGGTATAC ATAGAAAACG 420 



£5 



989 
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10 



TACTTATGTG GAAGCACAAA AAGATGTTGC AAATGTTTTG GAAAATGTGG AGCAAGTAGA 54 0 

TGCGGTTGTT GGAGCAACTG ATACGATTGC ATTAGCTGCC TATAAATATT ATTCTOATAA 600 

AAAAGATGTT ATGAAACCAC ATCAAATATA TGGTTTTGGT GGTOACCCAA TGACACAATT 660 

AGTGTCTCCA TCGATAAAAA CAATTCATTA TAATTATTTT GAAGCTGGCC AATGCGCGAT 720 

GGaAGAGATA CAACAGATGC TTAAAAAGCA AGATATGCCA TATAGCGTCA CAGTAGATGT 780 

TAATATTTAG ACGCTGTATT TTTTAAAATA AATGTGGAAC CGATACCATA TAACTATAAA 64 0 

TGGATAGGTT AAAAGTTAAA GAACOTAGGT AAAATTTGCT ATAATAGAAT ATAAATTGTT 900 

1S AACAGCATAA ATTATAAAAG GAGGACTGGG TAAATATTAT GACCGAATQG ACTAGAGAAG 960 

AACGTTATCA ACGAATCGAG GACGTTGATA CTGAGTATTT TAAAACATTA AAACAACAAG 1020 

TTGATCAATC AAAATTTCGT CAACAATTTC ATATACAACC AGAAACAGGC TTATTAAATG 1080 

20 ACCCCAACGG ACTTATTTTT TATAAAGGGA AGTATTATGT TTCACATCAA TGGTTCCCAT 1140 

TAGGCGCAGT ACATGGCTTA AAGTATTGGT ATAACTACAC GAGTGATGAC TTAATAAACT 1200 

TTAAAGCTGA AGGGCCAATT TTAAATCCAG ATACTAAATA TGACAGCCAT GGTGTATATA 1260 

25 

GCGGTAGCGC TTTTGAATAT AACGGGCATT TATATTATAT GTACACAGGA AATCATCGAG 1320 

ATAATCATTG GCAACGACAT GCGAGTACAG ATGATCGCAC GATTGAAAGA AGACGGTTnC 13 BO 

AGTTGGnAAA A 1391 

30 

(2) INFORMATION FOR SEQ ID NO: 225: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 93 0 base pairs 
3S (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 225: 

ATTTATTTTA ATGTTTATAT TTTCTAACAC TTTTTTATGA TCATAGTAGT AATTGACATT 60 

TTTCAATTCA AAGACTGGTG TCATCGTATc TCACCTCGCA TTCAACTATA CAACTCCTAG 120 

TAACATATGT AAACAGTAAT GTTTACGACT CAAAATTAGA CAAAATAAAG AGATATGCCC 180 

CCTTCAAGTT TTATTTATCG CATTTCTTGA AGAGAGCATT ATCATTTTAT TGTTGCATAA 24 0 

CCTTATTTTT TAATTCTGGG TCAAATTGCT GTTGTTTTAA CATTTCAATT TCAAGTTTAT 300 

ATGGCGGTTT TTTATTTTTC TTATCTTCAC CAACATAAGG TGTTTCTAAG ATTTTCGGAA 360 

TATCTTTAAA ACTATCATGA TGCACAATGT AATTTAATGC ATCAAAACCA ATGTAACCGA 420 

55 



45 



50 
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GAACAACTTT GATTCTGTCG ACTCCAATGA TTTTATCAAA TTCATTTAAT AOGCCATCAA 540 

AGTCCTCTTT AACATTATAT CCAGCATCAT GCGTATGACA TGTATCAAAA CATACTGATA 600 

5 AACGTTCGTT ATTATGAACT CCATCAATAA TACGTGCTAA CTCTTCAAAT GAGCGACCAA 660 

TCTCTGTACC TTTACCTGCC ATCGTTTCAA GCGCAATACG TACATTATTG TCATTCGTTA 720 

AAACTTCATT TAATCCTTCA ATAATCTTAT TAATTCCGGC ATCAACACCA GCTCCAACAT 780 

10 

GCGCACCTGG ATGTAATACa ATATCTTTAG CCCCTATAGC TTGCGTTCTk TCaATTTCTT 84 0 

GTTGCAAGAA ATCTACACCA AGATTAAACG TTTCTGGTTT GGTTGTAttG CAATaTTaAT 900 

15 GATGTATGGT GGCATGAACA ACAATATTAG g 30 

(2) INFORMATION FOR SBQ ID NO: 226: 

(i) SEQUENCE CHARACTERISTICS j 

(A) LENGTH: 1984 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 226: 



30 



35 



45 



SO 



TGACG CACCA 


ATTTATAACG 


CAATTGACAA 


AACAATTAGA 


TATACCTGTG 


AAATTTGTAC 


60 


CTGGAAACCA 


TGATTTATGG 


GAAGTTGAAA 


GTATGACTAC 


GCAAGACATT 


TGGAATAATT 


120 


ATAAGAGTAT 


GTCACAGTGC 


TTGGTAGGAA 


AACCATTTAT 


AGTAAATGAA 


GAATGGGCAA 


180 


TCATAGGACA 


TACTGGCTGG 


TATGATTATA 


GCTTTGCAGC 


ACAACGATTT 


TCATTAGATG 


240 


AGTTACAAAA 


AGGAAAACAT 


TATGGTGCGA 


CTTGGCAAGA 


TAAAGAACGA 


ATATCTTGGG 


300 


GCATATCAGA 


TCAAAATTTA 


TCTAAAATAG 


CGGCTGAACA 


AGTGAAGAAA 


GATATATTAG 


360 


AAGTAGGAAA 


TAGACGAGTG 


ATTTTAGTCA 


CACATGTTGT 


GACGCACCCT 


GATTTCATTG 


420 


TTCCTATGCC 


GCATCGTATA 


TTCGATTTTT 


ATAATGCATT 


TATTGGGACA 


AGTGATTTCA 


480 


ATCCTTTGTA 


TGCGATGTTC 


GATATACCAT 


ATAGTATTAT 


GGGCCATGTT 


CATTTTCGTA 


540 


AAAGTGTGAT 


AGATGATGGC 


AGATGTTATC 


TCTGTCCGTG 


TCTAGGCTAT 


CCAAGACAAT 


600 


GGOGTTCAGA 


AGATATTTAC 


CAGGAAATAA 


ATGAGACGAT 


ACAAATAATA 


GAAATTTAAA 


660 


ATGCGCAAAC 


CTGACCCAGT 


TTGCGCATTT 


TATGTTTTAC 


ACACGCGAGT 


AATGTGTTTA 


720 


CTTACGTGTG 


TTTATTTTGT 


TGCTGATTTT 


CAATTGTATA 


TGAATGTGGT 


TGCACATAAA 


780 


TGCACTTTCT 


TCCTGGTGAA 


TTAAAGCTGT 


ATTCCATTTT 


CTCTTTACGA 


ATTTTAATAA 


840 




ATTTGGAATG 


ATGGCAGGTA 


AAACTAGGCC 


ACGACGAATA 


TGACTCCAAA 


900 
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TTGAAACTTG TTTCGCTGGC TTOTTATCAA AGCGGAAAAC AC6TAGTAAT GGTTTAGAAC 1020 

CAAGATTAGT ATGGTATATT AACACAGGTT GACCTTGATC GATAATACCT TTAAGATCTT 1080 

CTAACGATTT ACCAGTGCCG TCTACGATAT TAGGATTGTA TTTTTGTAAA AATGGTACAT 1140 

ATGCTTCTGG AAATATCGTT TGATGATAAT TGCCAAGCTT AATGAATAAG TGATGTCCAA 1200 

CATAACCTTT ATGTGGATTG TTCGGATGTG TCGGCCAATG TCTCATAATT TCTGTAGCAG 1260 

GGATATGTTG GTTGTTGTAT TGCAACATCA TGGCTGCGGA AACACCTTCA CACCCCATGA 1320 

CCATAGGGAT AGGAAATAGC TGACTGATAG GTTTAACTGG TAATATTTTT CGGTTCATAA 1380 

TATAGTCCTC GCATTGATTC AATAAATATT TAATATAATT ATATAGCGTC AATCCAAAAT 1440 

GTCCTAAACA TATGTTTTAC ATGAGTGAAT AAAATTAATG GAGTGATAAA ATGGAATATC 1500 

AATTACAACA ACTTGCGTCG TTAACGTTAG TAGGTATTAA AGAAACGTAT GAAAATGGAC 1560 

20 GACAGGCTCA GCAACATATA GCAGGGTTTT GGCAAAGATO TTATCAAGAG GGAGTAATTG 1620 

CGGATTTACA GTTAAAAAAT AATGGTGATT TAGCCGGGAT ACTTGGCTTA TGTATACCTG 1680 

AATTAGACGG TAAGATGTCA TATATGATTG CAGTTACCGG AGATAATAGT GCTGATATTG 1740 

25 AAAAATATGA TGTCATAACA TTAGCAAGTT CAAAGTATAT GGTATTTGAA GCACAGGGCG 1800 

CAGTACCTAA AGCAGTTCAA CAAAAAATGG AAGAGGTTCA TCACTACATA CATCAATATC 1860 

AAGCAGATAC GGTAAAATCA GCACCATTTT TTGAGTTGTA TCAGGATGGT GATACTACAA 1920 

30 

GTGGAAAATT AATATTACCA GAAATTTGGG ATnCCTGTTA AAGGGGTGAT TGAAATAnGA 1980 

AnTG - 1984 
(2) .INFORMATION FOR SEQ ID NO: 227: 

35 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6373 base pairs 
- (B) TYPE t nucleic acid 

(C) STRAND EDNESS : double 
40 * iO) TOPOLOGY: linear 



45 



50 



55 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 227: 

GATTCCACGT GTGTTAAAAG AAGTTACAcC TTCAATGATG GTATTTACTA ATTTCTTTAG 60 

AGATCAAATG GATCGCTTCG GTGAAATTGA TATTATGGTT AATAACATTG CAGAGACAAT 120 

TAGTAATAAA GGCATCAAAT TATTGCTAAA TGCTGATGAT CCATTTGTGA GTCGTTTGAA 180 

AATCGCAAGT GATACGATTG TGTACTATGG TATGAAAGCA CATGCCCATG AATTTGAACA 240 

AAGTACGATG AATGAAAGTA GATATTGTCC AAACTGTGGT CGCTTATTGC AATACGATTA 3 00 
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10 



i$ 



20 



25 



30 



35 



40 



45 



60 



AAAATATGAA ATATCAAGTT TTGATGTGGC ACCGTTTTTA TATTTAAATA TCAATGATGA 
AAAATATGAT ATOAAAATTG CAGOTGACTT TAACGCTTAT AACGCGTTAC AGCATATACT 
GTTTTAAGAG AGCTAGGGTT AAATGAACAA ACAATTAAAA ATGGCTTTGA AACGTATACA 
TCAGACAATG GTCGTATGCA GTACTTTAAA AAAGAACGAA AAGAAGCGAT GATCAATTTA 
GCTAAAAATC CTOCAGGAAT GAATGCAAGT TTATCAGTTG GTGAACAATT AGAAGGCGAA 
AAAGTGTATG TTATTTCGCT AAATGATAAC GCTGCAGATG GTCGAGATAC TTCATGGATT 
TATGATGCAG ATTTTGAAAA ATTATCTAAG CAACAAATTG AAGCTATCAT CGTGACAGGT 
ACACGAGCAG AAGAACTTCA ATTGCGATTG AAGTTAGCAG AGGTTGAAGT ACCAATTATA 
GTTGAGCGTG ATATTTATAA AGCAACGGCA AAGACTATGG ATTATAAAGG TTTCACAGTT 
GCAATACCAA ACTATACATC ATTAGCGCCT ATGCTTGAAC AATTAAACCG TTCGTTTGAA 
GGAGGTCAAT CATAATATGC ATGAATTGAC TATTTATCAT TTTATGTCAG ATAAATTGAA 
TTTATACAGT GATATAGGAA ATATTATTGC TTTAAGACAA CGTGCTAAAA AACGAAATAT 
TAAAGTTAAT GTCGTAGAAA TCAATGAAAC AGAAGGTATT ACCTTTGATG AATGTGATAT 
TTTCTTTATC GGTGGTGGAA GTGATAGAGA ACAAGCATTA GCAACAAAAG AATTAAGTAA 
AATTAAGACA CCACTTAAAG AAGCGATTGA AGATGGTATG CCGGGATTAA CGATTTGTGG 
AGGCTATCAA TTTTTAGGGA AAAAATATAT CACGCGTGAT GGTACAGAAT TAGAAGGGTT 
AGGTATTTTA GATTTTTATA CTGAATCAAA GACAAACCGA TTAACAGGAG ATATTGTTAT 
CGAAAGTGAT ACTTTTGGAA CTATTGTAGG TTTTGAAAAT CACGGTGGTA GAACATATCA 
TGATTTCGGT ACACTTGGTC ATGTTACTTT TGGTTATGGT AATAATGATG AAGATAAAAA 
AGAAGGCATT CATTATAAAA ATTTATTAGG TACTTATTTA CATGGACCAA TTTTACCTAA 
AAATTACGAA ATCACTGATT ATCTGTTAGA AAAAGCTTGT GAACGTAAGG GTATTCCGTT 
TGAGCCTAAA GAAATAGATA ATGAAGCGGA AATACAAGCG AAACAAGTAT TAATAGACAG 
AGCAAATAGA CAGAAGAAAT CTOGTTAACT CTGAACATCG CATCAATGGA TTTAATATTG 
ATAAACGATG AAGTTTAGTA ATTAATCATA TATGTATAAA CACACACATT ATTTTGGATG 
GAAACAACCA AATTGATGTG TGTTTTtTTG TTCTAGTGAA TAATTATTAT ACAATGAGTA 
TCTATCCTAG AATTATCAAT AGTAATGGTG ATTATGCAAC ATGAAAAAAT GAATGATGAA 
AGGAATTTGA CGATGAAGCC TACTAAAGTG ATATTAAAAG ATGCATCTTA TTTACATAGC 
AAAACATCGA TAACATTTAT TTTAAAAGAT GTAGTTATCG AAGAAGATAA TAAAATTTAT 
TATTTCGACA CTAGTGCAcT TTCGAAGATC AAGAAGTTAA ATTTGAATTT GCACTCTTTG 



420 

480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
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TTATAGAACC TGATTTACAT TTTACAATTA TTOATTTTAA TCAAQAACTG CTTTOTATTT 2220 

ATATTGATTT TGATTCTGGT TTAAGGCATT CAAACATGGC AACAGAATCT GGTATTTCAT 2280 

TAAGGATAAA TGTTGCTAAA TCAGATTTTA CTAAATTTAT TAATGAATTA GCCTCTTTAC 2340 

ATTAATGATT TAAATCTGAT ATGTAATTAC AATCAAAAAA GACAGCCACA TCCCTCCOTA 2400 

GTTTAOGCGT GTGGCTATAT TTGAGTCTGA ATATTTATGC TTGTAATTTT AAAAAGGGAC 2460 

ATGCTATATA CGATAAAAAG AGGCGGGGAC ATAAATCAAT GTTCTATGCT CTACGAAGTT 2520 

ATATTGGCAG TAGTTGACTG AACGAAAATG CGCTTGTAAC AAGCTTTTTT CAATTCTAGT 2580 

CAGGGGCCCC AACAAAGAGA AATTGGATTC CCAATTTCTA CAGACAATGC AAGTTGGGGT 2640 

GTGGGCCCCA ACACAGAGAA TTTCGAAAAG AAATTCTACA OGCAAAGOOA GTTGGGGTGG 2700 

GACGACGAAA TAAATTTTAT GAAAATATCA TTTCTGTCCC ACTCCCATGG TGCCAATTAG 2760 

20 CATAAGGTAC TTAAATTAAG CATATCTGCT GTCTAGCAGT CGATAAATCA TTAGAACTTC 2820 

GTATAGTATA TGACTTTTAA TTTGATTTTC ACCACTAATT TCAAGTGCTT TTATAGTCGA 2880 

ACGTAAAGTT TCTACAGAAT CATCTTCTCT CTTAAAAGAA C CAT CAT AAA ATATATCTTT 2940 

25 GATG CT ACT A CTAATTTTTA GCAATG C CAT TTTTTCGTCA CCTGAAAAGT TAACACGAGT 3 000 

ATTTTTAGGC AAGTAAATGA TATTTGATAA ATGAGTGATA AACAAACGAT TCGTATATGC 3060 

ACGTTTAGTT AATTGATTGA GTAATTTCCA ATCACATTCT TTTTTCTTAT GATAGCTTAA 3120 

30 

TTCATCACGT TGATAACTTA TTAACGTTTC AACTTGATTA TTTAAATTGA AAATATTTTT 318 0 

ATATGCFFTT TCGCTTTTAT CAGATTGCAG TCTTGATAAG ATAAGTTCTT GGCAGCGATT 3240 

GTAAAATAAT TTATACATCA AGGCAT CTGT CTTACTTAAT TTTTCTTCGA CCTGACCATA 33 00 

35 

ATACTTAGGT GGAAACACCA TGAAGTTAAT TAAACCTGAT GTCACGAGTC CAATAATTGC 3 3 60 

TCTCAATGTT CGAGACAAAA AGTTGAATAT GTAGGCATCA TGAATACCTG GAATCATAGC 3420 

40 TAATGATGTT AGTACAGCGA CATTCGTACC AACTTGCAAT TTGAGTTTTG TACAGAATAA 34 80 

AATCGTGAAC GTTGCACTCA ATGCATATGT AAAAGGTGAT TGATCGCCGA ATAAATATGT 3 540 

AAATAATACT GCAAAGCCTG CACCAATTAC CGTAGCAGGT AATCTACGAT AACCTTTAAT 3 600 

AAGTGATGCC TTGGCAGTTG GTTCAATTGT GACTACAGCT GTTAAAATGG CATAGATGGG 3 660 

TGTTAAATCT AGTGCCATAC AAAAGACAGC TGTTAAAAAA ATGGCAATAC CAGTTTTAAT 3720 

TGTTCTGGCA CCAATTAAAT GTTTATACCA TTGATCGTTC ATTTTTTAAC CTCTAATCAT 3 780 

CGTAAAATCT TAGCGAGCGC TTTATAATAA TAGTATCGTA CATTGGAAAA GTTCATGTAT 3 840 

GTAAAATATT TGAAATAATC ATACATAAGC ATTACTTTGA TTTTCATATA CATTAATGAA 3 900 
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15 



20 



25 



35 



40 



45 



CAAGCATTTT TCAATTATAG TCOGGGGCCC CAACATAGAG AATTTCAAAA AAGAAATTCT 4020 

ACAGG CAATG CAGGTTGGCG GGGCCCCAAC ACAGAAGCTG ACGAAAAGTC AGCTTACgAT 4080 

AATGTGCAGG TTGGCGGGGC CCCAACATAG AGAAATTGGA TCTACAATTT CTACAGGCAA 4140 

TGCAAGTTGG GGTACAACGA TAAAGAAATA 1 ATnTCTTT ATCACACTAT GTCTCACTCA 4200 

CTTTCCAAAA TACTAAAGTA ACATCTTTAG TATATCAAAG AATTTTTGCT ATAATAAGTT 4260 

ATAATTATAT AAAAAAGGAA CGGGATAAAA TGATTGTAAA AACAGAAGAA GAATTACAAG .4320 

CGTTAAAAGA AATTGGATAC ATATGCGCTA AAGTGCGCAA TACAATGCAA GCTGCAACCA 4380 

AACCAGGTAT CACTACGAAA GAGCTTGATA ATATTGCGAA AGAGTTATTT GAAGAATACG 4440 

GTGCTATTTC TGCGCCAATT CATGATGAAA ATTTTCCTGG TCAAACGTGT ATTAGTGTCA 4500 

ATGAAGAGGT GGCACATGGG ATTCCAAGTA AGCGTGTCAT TCGTGAAGGA GATTTAGTAA 4560 

ATATTGATGT ATCGGCTTTG AAGAATGGCT ATTATGCAGA TACAGGCATT TCATTTGTCG 4620 

TTGGAGAATC AGATGATCCA ATGAAACAAA AAGTATGTGA CGTAGCAACG ATGGCATTTG 4680 

AGAATGCAAT TGCAAAAGTA AAACCGGGTA CTAAGTTAAG TAACATTGGT AAAGCGGTCC 4740 

ATAA.TACAGC TAGACAAAAT GATTTGAAAG TCATTAAAAA CTTAACAGGT CATGGTGTTG 4800 

GTTTATCATT ACATGAAGCA CCAGCACATG TACTTAATTA CTTTGATCCA AAAGACAAAA 4860 

CATTATTAAC TGAAGGTATG GTATTAG CTA TTGAACCGTT TATCTCATCA AATGCATCAT 4920 

TTGTTACAGA AGGTAAAAAT GAATGGGCTT TTGAAACGAG CGATAAAAGT TTTGTTGCTC 4980 

AAATTGAGCA TACGGTTATC GTGACTAAGG ATGGTCCGAT TTT AACGACA AAGATTG AAG 5040 

AAGAATAGTT CAACATATAC TAAGACTAAA GTATGAACAT CATTTAGTTC CGGAGCCTAT 5100 

TCATATTGGT TTCGGAACTG TTTTATAATA ATTAAGAACA CAATCAATGC GTCATTTCAA 5160 

AAATATGTTG TAACAAAGTA GTTTTTAAGC AAACATATCA TCGACATCAA CGAAGATACA 5220 

TAGCGCATTT GGTATTTTAA* AACTTATTAT AAAAGGTGAT AGTTATGAAC TATGTTGAAC 5280 

GTTATATTGA ACAGTTTTTG AGAGCAACAG TAAGAAATAA TATCAAGCAC TACCTTTTAA 5340 

TGCTAGATGA AAAAATGAAA AATTTAGATG ATTATATGCG TTATTTAATT ACTAAAAAAG 5400 

AACAACTTAG CAAGTTAATT GACAGTCTAA TGCTAACATT AGAAAATAAA TATATTGATA 5460 

TTGCTGAAGC ATTTCAAATT CAATGTGCAA GAGAAATCAA TAATCAAGAA ATTGAAAATA 5520 

TTAAATCAGA GTTGAATAAA GTTGAAGCAT ATTATGCACA AATTGAAACT CAAATTCAAC 5580 

AAACTTCAAC TGAAAAAATA GCAACAGAAA AAACATCGTA TCTAATAAAT TATATGAACG 5640 

CTGTGGCATA GAAAGGCGGC GAAACATGAC ACACAAATAT ATATCAACGC AAATGTTGAT 5700 
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w 



CTTTTTACTC OTTCTATTAT TGGGATGTGT ATTAGTTTAT GTAQGATATC TTTATTTTCA 5820 

TAAAATACGT GGCCTTTTGG CGTTTTGOAT AGGCGCGCTA TTAATTGCAT TCACATTATT 5680 

GTCTAATAAG TATACAATCA TCATCTTGTT CGTCTTTTTA TTATTACTTA TTGTGCGTTA 5940 

TTTAATACAC AAGTTTAAAC CAAAAAAAGT AGTTGCGACG GATGAGGTTA TGACTTCACC 6000 

ATCTTTTATT AAACAAAAGT GGTTTGGTGA GCAACGTACA CCAGTTTATG TATATAAGTG 6060 

GGAAGATGTA CAAATTCAAC ATGGAATTGG CGACCTACAT ATTGACTTAA CAAAAGCTGC 6120 

AAATATTAAG GAAAATAATA CCATTGTTGT TAGACACATT TTAGGTAAAG TGCAGGTTAT 6180 

15 ATTGCCGGTT AATTACAATA TTAATTTACA TGTAGCTGCT TTTTATGGAA GTACTTACGT 6240 

GAATGAAAAA TCATATAAAG TTGAAAATAA CAATATTCAT ATTGAAGAAA TGATGAAACC 6300 

GGATAACTAT ACAGTTAATA TCTACGTATC AACGTTTATC GGAGACGTAG AGGTOATTyA 6360 

20 TCGATGAAyC ACT 6373 

(2) INFORMATION FOR SEQ ID NO: 228: 

(i) SEQUENCE CHARACTERISTICS i 
2S (A) LENGTH: 44 88 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 228: 

ATAGnGAAAG CGTTTTACAC TTAATAACTC CCTCTTAAAT GCATCCAGGT TCTATGTAGT 60 

3S AAATCATGAA nATAACATAT AAATnTAGAG GAGATTTACC TTTGAATACA GAGAACAACA 120 

AGAATCAAAA CCAATCTGTT AAAAATTCTG AAAGaCGCGG CATGTTAAAA GGATGCGGCG 180 

GTTGCCTTAT TTCTTTTATT TTATTAATAA TCTTATTATC AGCCTGTTCA ATGATGTTTA 240 

40 GTAATAATGA CAATTCCACT AATAATCAAT CATCAAAAAC GCAATTAACT CAAAAAGATG 300 

AAAATAAAAA TGAAGATAAG CCTGAGGAAA AATCAGAAAC AGCAACAGAT GAGGATTTAC 360 

AATCAACCGA AGAAGTACCT GCAAATGAAA ATACTGAAAA TAATCAACAT GAAATTGATG 420 

AAATAACAAC AAAAGATCAA TCAGACGATG ATATTAACAC ACCAAACGTT GCAGAAGATA 480 

AATCACAAGA CGACTTGAAA GATGATTTAA AAGAAAAGCA ACAATCAAGT AACCATCATC 540 

AATCCACGCA ACCTAAGACC TCACCATCAA CTGAAACAAA CACGCAACAA TCATTTG CTA 600 

ATTGTAAGCA ACTTAGACAA GTATATCCGA ATGGTGTCAC TGCCGATCAT CCAGCATATC 660 

GACCACATTT AGATAGAGAT AAAGATAAAC GTGCATGTGA ACCTGATAAA TATTAAACAA 720 

ss 
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GGGAGATTTT 


TTAGGCATGA 


GCAATCAATT 


CAAAAGCGAA 


GAAGAGCGAA GACAATGGGA 


840 




ACAATTCCAA GCTTTCCAAA ATCAACAAAA CCAACAGAAC 


CAGCAATACG GACAAAAGAA 


900 


5 


ATCTAAAAAA 






TGGTTGTCTA 


GTATTATTTA TTTTAATTAT 


960 




CATCGGTATT 


TCAGCTTGTA 


CAGCTGGTAT 


TACAGGTAAC 


CTTGGCGGAA ATAGTTCTAA 


1020 


10 


AGAAAOGAAC 




AAATCGGTGa 


AACTGTTAAA 


AATGGCGACC TTGAAGTCAC 


1080 






TGAAATCTGT 


AGGACCATCT 


CTTGCACCAA CAAACGCTAA 


1140 








ATGTGACGAT 


TAAAAACAAA 


GGTAAAGAAG CGTTAACAAT 


1200 


IS 




ATGTTTAAGC 


TAAAATCCGG 


TGATAAAACA 


TTTGAAGCAG ATAATACAGG 


1260 




TTCAATOTCT 


GCTAATCAAA 


GTGACAATGG 


TAGTATAGAA AATTCATTTT TCTTACAGCG 


1320 




TATAAATCCA 


GATAGCACTG 


CTCAAGGTAA AATTGTTTcG ATGTGTCAGA AAACATAGCC 


1380 


20 


AACGCAAAaG 


ATAAAAAATT 


AGAAGTTATT 


TCTAGTTTAT 


TTAGCGTCAA GAAGATTACA 


1440 




TTTGATTTAT 


CCGATGCTAA 


AAAAACATCA 


AAAGCTAAAA AAGACAAGCA AGATACAGAA 


1500 




GTAGCTGTTG 


CGAGTTCAAA 


TAGCGATAAT 


GTAAGTTATG 


AAGCTTCGGC TACTACACCT 


1560 


25 


GCTACAACTT 


CTAGTGCGGA TACTGATTCT GAAGATAGCG AAAAGTCTAG TAAAGATGAG 


1620 




GATAAGCAGA ATGCGTCTAA AAgTGATAAA TCTAGTGTAG AAAAAAGTGA ATCTAATGAG 


1660 


30 


GAAACTGCTC . 


CTGTAGAGCC 


CATGCCCCAT 


AGCAAACCTA 


CCACTAGTGA aGCACCACCT 


1740 


AGCCAAAATA 


TTCACAaTG a 


AGATAGCmTG 


TACGACGCTT 


CAACAGAATA AAATtnyCAG 


1800 




tAGCTCGGCT 


ACCCTTCTTT 


TACGGAAAAA 


TTAATT AT AC 


ATAATCaAAT CaAGGAGATA 


1860 


3S 


AAAAAATGAA 


ATTCAAAGCT 


ATCGTTGCAA 


TCACATTATC 


aTTGTCACTA TTAACTGCCT 


1920 




GTGGTGCTAA 


TCAACATAAA 


GAAAATAGTA 


GTAAATCAAA 


TGACACTAAT AAAAAGACGC 


1980 




AACftAACTGA 


CAACACTACA 


CAGTCAAATA 


CAGAAAAGCA 


AATGACACCA CAAGAAGCCG 


2040 


40 


AAGATATAGT 


TCGAAACGAT 


TACAAAGCAA 


GAGGCGTTAA 


TGAATATCAA ACATTAAATT 


2100 




ATAAAACAAA 


TCTTGAACGA 


AGCAATGAAC 


ATGAATATTA 


TGTTGAACAT CTAGTCCGCG 


2160 




ATGCAGTTGG 


CACACCATTA 


AAACGTTGTG 


CTATTGTTAA 


TCGACACAAT GGCACAATTA 


2220 


45 


TTAATATTTT 


TGATGATATG 


TCAGAAAAAG 


ACAAAGAAGA 


ATTTGAAGCA TTTAAAAAGA 


2280 




GAAGCCCTAA 


ATACAATCCA 


GGTATGAACA 


ATCATGATGA 


AACAGATGGT GAGTCAGAAG 


2340 


50 


ACATTCAACA 


TCATGACATT 


GATAATAACA 


AAGCAATTCA 


AAATGACATA CCAGATCAAA 


2400 


AAGTCGACGA 


TAAAAATGAT 


AAAAATGCTG 


TTAATAAAGA 


AGAAAAACAT GATAATGGGG 


2460 




CAAATAATTC 


TGAAGAAACT 


AAAGTTAAAT 


AATGGCATAC 


TTTGATTAAT CGTAATTTTT 


2520 



55 



997 



EP0 786 519 A2 



10 



ACTATGCATG GTCTTTTTAA TCAACTTAAA CTCGOCATTA TTTCAATCOA AAACGCAGAG 2640 

CATACGCTTT TTACACCTTA TATGTTGGAA ACGCTCTCTT CCCTAGGCGT GAAAGACAGC 2700 

ATTGTCGATT TAATTCATAA AGGGACTGAA TTAGAAGACT TTGCGGCATT TAATTTATCA 2760 

ATTGAAGACA CAGTTACAGT CTGTTTACAA AGAACTGAAG AACTATTAAA ACAATACAAA 2820 

AATGTGGAAT TCAATGACAA AATATTAATC AATTGGCGTA TTATACAAGA GAAATAGACA 2880 

TATAAAAGTC GAATGTAACt ACGTGAGTAT TGATTTTATT CTTTGTAAAT TACAAGCATT 2940 

TCATATTATA AAGTTTGAAA AGAGGTATAT TGAAATGGAG AAAAATGAAT ATATAGCTAA 3000 

1S ATATAATGAA TATAGTCAAT TATTAGACGC TACATACTCG CAAQCTGTAG CATmCCTTTT 3060 

AAGtAAATaT GGCGCTGTAA CCGATGATTA TTATAAAGaA AAATCATACA CGCGATTTTT 3120 

AAAtGGAGnA ATCAAAAGTA TTTCAAAAGG AAAATACACT AGAGCTAGCG AaGGATTATA 3180 

20 TTGCCATCAT ATAAGCGAGG ACAAATTCCA AAATCTATCT GATCTAAGAT TCATtTCCAA 3240 

ATTTAAGTAC TCATACGACG TTCAAAAGAA AGAAAACTTA GTGTACTGTG ATCTAATCGA 3300 

GCATTTAATT TTACATGCAA TTATTACAAA AGAATCCCAT GGCCAATTTG GTGTAGCTGG 3360 

25 

ATTATGTCAA ATGATCAAAC CAACAGTCAT TGATTGGTAC ATTGGCGAAT ATAATCCAAA 3420 

ACCAGCATGG ATGCAAGCCA CCAAAGCACG TGCCTATTTG CCTGGAATAT TAGTAGAGAA 34 80 

ATTACTCATT AAAATTGACG ATATGTTAAA AGGAATAGAA ATATAAGATT TCCTTGAGTC 3540 

30 

TAGATAAATG ATTAATGTAG ATTTATTTTT TGCTGTTGAG ATTTTGTTAT AGATGTTTAA 3600 

ACCTGTAATT AAATATATTT TATAAAATAG ACCACGCATA CCTATCTATA AACGGrCAAT 3660 

35 GTTTATAAAT GAGTTTGCAT GGtCTTGAAT TGTATTAAAT TTCTTTTGGT TTTAATAAAT 3720 

CGACTAGATT TTCACAATAT TTATCAAATA TGTATTCCTA AATTATACAG CCTTAATCCA 3780 

GCA<JCTACTT TCGAAACTTC CAACTTAGTT GATATAAGGT TCAATAGTTT GTTTCGTTCT 3 840 

40 TTTTCAGATA AACCAGAACT TAAATTGATA TTATTGACTT CATAAAAATT ATAGACTAAT 3900 

GCCTCTATTT GCTTTTTAGG CATAAGTAAG TCGACTGAAA ACTGATTTAC GTCG CTTTCA 3 960 

TAAATCATTT CATGTAAATT CTTTAGACTA TTATCGTTAC TATCTCTCAT TAAGTCTGTA 4020 

TTTTTAAATA AATAACGGCC CAATTCACGA GCTATTGAAA ATCTTGTATT ATTAATCGAG 4080 

TGATTATTAT TAATATAGAT TGTTCTTCCA CTTAAATAAC CCGAAGTATT ACCCTCCATT 4140 

TTAATATATC TAACATTTAA ATTAAGTTGA AATAATAGCT TGTCTATGTC AATAGCAAAG 4200 

TGTTCAGAAG TAATAAAAAG TTGATCCATT TTGTCCTTTA TAAATGCCTG AAATAATCGA 4260 

ACTATTTTTG ATTCTAAAAT ATCTTCATAA TGAACTTTCT CAATAACTTT CAATTGATTC 4320 
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AACATTATTA AAATAAAACC CCTCTACTAC TATATGTAAC GAAGGGACAT GATTTCAAAA 
TAAAATACCT TTTTTATAAA TnTATTATAA TATCCCCCAC TATACnAC 
5 (2) INFORMATION FOR SEQ ID NO: 229: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 84 6 base pairs 

(B) TYPE : nucleic acid 

10 (C) STRANDEDNE SS : double 

(D) TOPOLOGY: linear 



1S <xi> SEQUENCE DESCRIPTION: SEQ ID NO: 229: 

TATGGCGCCA TATTAGTTGT AACTGGTTTA AGAGGTCcAa GAAaTATCaA ATAAAGTTGT 60 

tCCTGGGCTT GGTACTGTTA TCTCaATATT GmwTOCaTTT GOTGGTCTAG CTTTTAATAT 120 

20 TGGTAATATT GCTGGTGCCG GTTTAGGTTT AAATGCAATT TTTGGATTAG ATGTAAAATG 180 

GGGCGCAGCT ATTACTGCAA TCTTTGCAAT ATTAATCTTT GTAAGTAAAA GTGGCCAAAA 240 

AATTATGGAC GTTGTTTCAA TGATTCTTGG TATTGTGATG ATTTTAGTTG TGGCATATGT 300 

GATGTTTGTT TCTAATCCAC CTTATGGTGA TGCTTTTGTG CATACATTTG CGCCAGAACA 360 

TCCAATGAAA TTAGTCTTGC CCATCATTAC GTTAGTTGGT GGAAcTGTar GTGGTTATAT 420 

TACCTTTGCA GGTGCACATC GTATATTAGA CTCTGGCATT AAAGGTAAGC AATATTTACC 4 80 

ATTTGTAAAT CAATCAGCAA TTGCTGGTAT TTTAACTACA GGTATTATGA GAACGTTACT 54 0 

ATTCCTAGCG GTATTAGGAG TTGTTGTAAC AGGTGTGACA CTAAGTTCTG AAAATCCACC 600 

AG CGTCAGTT TTTGAACACG CAATTGGACC AATTGGAAAG AATATTTTTG GTATTGTGTT 660 

ATTTGCTGCA GCTATGTCAT CAGTAATTGG CTCAGCATAC ACAAGCGCAA CATTTTTAAA 720 

AACACTTCAT AAATCACTTA ACGAAAGAAG TAATTTAATT GTGATTGTGT TTATCGTTAT 780 

40 TTCAACAATG ATTTTCTTAT TTATTGGAAA ACCAATCAGC CTTTTAATTA TAGCAGGCGC 840 
GATAAA 

(2) INFORMATION FOR SEQ ID NO: 230: 
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(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 2072 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 230: 
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TCTTTTTAAA AGOTACTAAT ATTTCTTTAG 
CCTTGAGTAT ATTATTATAG ACGGAATCTG 
5 ACCTCCTTAT GTTGTCAGCA TAAAGGATAA 

CTAATTGAmA AAAATTAAGA AAAGTATGTG 
GGCGAATAAG TGTCTaAAAG CATCTTAAAG 

w 

ATAAGGGaAA ATCCTTATGT TCACTTTTTC 
TACTTTGTCT ATATTGAATG TTTTCATATA 

1S CTAATATATA GGCAGAGTAT TGATATCTAT 

ACGTATGTAC AAAACAAAAG GTGGCTTTCA 
TGGGTTTATG GCTTGOAGTA TAATTGCGCC 

20 TGTTACTGAA GGTCAAATAT CAATCATTTT 

CCGTGTGCCA TTTGGTTATT TAACAAACAT 
TTTTATCGTA TTGTTATTCC CGATATTTTT 

26 AATGGCTTCA GGATTTTTCC TTGGTGTAGG 

AGTTCCTAAA TATTTCCCTA AAGAAAAAGT 
AAATATGGGT ACAGCAGTTT CTTCATTTTT 

30 

GCAAACAACA GTTAGAAGTT ACTTAATTAT 
TTTTGGTGAC ACACAAGAAC GTAAAATTAA 

3S ATCTAAAAAC TACAAATTAT ATTACTTAAG 

TGTAGCATTT GGTATTTTCT TACCTAACTA 
AGATSCTGGT ATTCGATCAG GTGTATTCAT 

40 TGGCATTTTA GGTGATAAAT TTAATGCAGT 

GATTATCGGT GCCATTATTT TAGGTATTTC 
TTTAACAATA AGTATTTGTG CAGGTATTGG 

45 

ATACTTCTTA AATGAAGCGG GATCCGCAAA 
AGGATTCTTC CCACCACTAG TAATCACGTA 
AGCATTTATT TTCTTAGCGG TATTnGGAnG 

SO 

CCAAAAAGAA TATGGCTCAT TGAAaAACGG 
TAAATACAAA GCCTTaATAT CATGCGCAAT 

55 



TGAAAATTGA 


ATCACGGTCG 


TTTATTGOTG 


120 


ATCTAATAAT 


ATTGATTTTA 


TACATGATAA 


180 


CGTAACGTGA 


TTTTCAAGCA 


GTAATTGTAA 


240 


AGTGTTCCTA 


AwTAATATGa 


TTAAAATGAT 


300 


GGACATTGTA 


TAGGGTAAAT 


CACTTCATAA 


360 


ACAATCATnA 


TAAAATATAT 


ATGTAGTCAA 


420 


AATGAAAGCA 


TTTTTAAATA 


ACATTGACCT 


480 


TAAAAAATAA 


ATGATTTTGA 


TGAAGGTGAA 


540 


ACTTACATTA 


CAAACATTAA 


GTTTAGTGGT 


600 


ATTAATGCCC 


TTTATTAAAC 


AAGATGTCAA 


660 


AGCGATACCA 


GTTATTTTGG 


GATCGGTGCT 


720 


TGTTGGCGCT 


AAATGGGTAT 


TCTTTACTAG 


780 


CTTAAGCCAA 


GCACAAACAC 


CGGGTATGTT 


840 


TGGTGCAATT 


TTCTCAGTTG 


GTGTTACATC 


900 


AGGTCTAGCA 


AATGGTATTT 


ATGGTATGGG 


960 


AGCACCACCG 


ATAGCGGGTA 


TTATTGGTTG 


1020 


TATCGCTTTA 


TTTGCATTAA 


TTATGTTCAT 


1080 


AGTACCATTA 


ATGGCtCAAA 


TGAAAmCATT 


1140 


TTATTGGTAT 


TTTATTACTT 


TTGGTGCTTT 


1200 


CTTAGTAAAT 


CATTTTGGAA 


TTGACAAAGT 


1260 


TGCGCTGGCA 


ACATTCTTAA 


GACCAATAGG 


1320 


TAAAGTATTG 


ATGATTGATT 


TTGTTGTTAT 


1380 


AGACCATATC 


GCATTATTCA 


CTGTAGGCTG 


1440 


TAACGGCTTA 


ATCTTCAAAT 


TAGTACCATC 


1500 


TGGTATCGTA 


TCAATGATGG 


GTGGTTTAGG 


1560 


CGTAGCTAAT 


TTAACAGGAT 


CAAGTCATTT 


1620 


TATTGCATTA 


TTTACCATGC 


GTCATTTATA 


1680 


TTGATATGTA 


ATACATGCCA 


TTcATTTAGT 


1740 


ATTCGTAGCA 


TGACATTAAG 


GCTTTAGTAG 


1800 
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CTTGGTTTGA TTTTAGGCAA GGTAATGGTT AATAACCCAT TTTCAAAACT AGCAGTAATA 1920 

TGTTGCTTAT CAACAGCTTC AAAATCAAAT TGACGCATTA ATGATTCGAA GTTACGCTCA 1980 

TCTAAAATGA GTTGTTCAGA TTTGTATTTT GCGCTTCTAG TAGCTTGAAT AGTGAGCGwA 2040 

TTAttATTGA AATCgATACT AATAtCTccC TG 2072 



(2) INFORMATION FOR SEQ ID NO: 231: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3159 base pairs 

(B) TYPE; nucleic acid 
<C> STRAND EDNESS : double 

t5 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 231: 



20 



25 



30 



35 



40 



45 



SO 



CGTCTTCTCT 


TGGTTATTCT 


CTGTGTTTTG 


TCTTTGTTCA 


AATTCGATTT 


TTTGTTGTTC 


60 


GAATGAATGT 


AATACTTTAT 


TTTTTTTTGG 


CACATAATCC 


AAGTnATTTT 


TAGGAATTAA 


120 


TATACGGTCT 


TTAAATGCTT 


CTTGTATTTT 


GCTCACAATC 


AATTGGTATA 


GTTGCTCTTC 


180 


TTTTGATAAA 


CGCACTTCTA 


GTTTTGTTGG 


ATGAACATTT ACGTCTACTA 


AGATTGGATC 


240 


CATTTCAATA 


TTAATATAAC 


AAATCGGGAA 


CCTACCTATT 


GTTAAGAGTG 


TATGATAGCC 


300 


TTCTAAAATC 


GCTTTATTTA 


GCATAAAGTT 


TTTAATGTAT 


CGTCCATTAA 


TAAAAATAGA 


360 


AATATAGTGC 


TTATTACTTC 


TAGAATGTTC 


AGGCTTTGCA 


ACAAAACCTT 


CAATGTGATA 


420 


ATCACTTGTA 


TCTCCAGATA 


TATGTACTAA 


ATCTCGTGCA 


ACTTTCATCC 


CATAAATCTC 


480 


TGCCATCACT 


TCATTAGTTC 


GTCCTGAACC 


ATTTGTACTT 


AACATTGTTT 


TGCCATCTGA 


540 


AATGAGTGCT 


ATTCGAATGT 


CCGGATGGCT 


CATTGCCATT 


CTGTTGACAA 


TATCTGTTAT 


600 


TTTACCTAGT 


TCAGTGTATA 


AACTTTTAAT 


ATATTTTAAA 


CGTGCTGGTG 


TATTATAAAA 


660 


TAATGATTCT 


ACAAGTATAT 


CTGTTCCTTT 


TTTCGCTTTT 


GCAGGCTTAT 


GATTTAATAT 


720 


TTCACCATTT 


TCTACATATA 


TTTCATTTCC ATTAGCATTA 


TCCGTGCAAG 


TCTTCAATGT 


780 


TACTTTAGCA 


ACTGATGAAA 


TACTGGCTAG 


TGCTTCACCA 


CGGAATCCTA 


ATGTCCTAAT 


840 


ATGAAATAAA 


TCTTCATCTT 


GATCTAATTT 


ACTAGTCGCA 


TGTCTATGAA 


ATACTAATCC 


900 


TAAGTCTTCC 


GCTTCAATTC 


CGCTTCCATT 


ATCGACTACG 


CGAATAGATT 


GGACGCCAGA 


960 


tTCCTCTACT 


TCAATGCTTA 


TTTCTGTAGC 


GCCTGCATCT 


ATAGCATTTT 


CCAACAGTTC 


1020 


TTTCACAACA 


GAACTCGGTC 


TTTCAACTAC 


TTCACCTGCT 


GCGATTTTAT 


TTGCTAATGA 


1080 


GGTTTGGAGT 


TCTTTAATTT 


TCCCCATTTT 


GCAACACCTC 


TATTTTAATT 


GATTTTGTAA 


1140 



55 
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TTGTAGTTCA ATCTCGCTTT TTTGATCATT 
GTCTTTTTGA GATAAAGTAT CaGTTGTTTC 
5 AATTTCCAGG TTCATTTTCG ACCATTTTTA 

ACGCTTCAAA CTCGCTTAGA ATCACTTGTG 
CTAATTTOGC AACTTGAATA CCATAAtATC 

10 

GAATATAAGT TCACCTTTAT ATTCATTAGC 
TGCTTGATCT AATGTTGTCA ATTCATGATA 

r5 TGTTTCAGCT ACATACTCTA TCATTGCCTG 
ACCACGTCCA ATTTCATCGA AAATAATCAA 
TTGTGCTTCT AGCATTTCTA CCATAAACGT 

20 ACCTATTCTA GTGAATATTT GATCAAATAT 
AGCTCCCATT TGGGCCATTA TACTAATTAT 
AGACATATTC GGACCTGTAA TTAAATATAT 

25 AGGCACATAG TCATTATAAT CCATTACTCT 

TTCTAATGTT TTATTTTCAC TAAATGAAGG 
TGGAAAGCTC TGTAAACAAT CTAGCTCTGA 

30 

AGTATATTTT TTAACTTCTT CACGTAGCTG 
TTTGTCTTCC GCACCTAAAA TGATATCTTC 

35 TTGAGCATTC GATAACGTTT GCTTCCTCAT 
CAAGTTGGCA CGTGTTATTT CTATAAAATA 
TGATTTTATT CCTGTACGTT GTCTTTCTTT 

40 GTTTTTTGAA GCTTCAAGAT ATTCATCTAA 
GCCATCTTTA ACTGAAATTG GTGGTTCTTC 
ATCATCaAGG GGTTCTAGTT GATTAACTTG 

45 TAATGCTTTA ATATTCGGTA TTTCAGAAAT 
ATTAACATTT CCGTAACTAA CACGCCCAAC 
ATATGTTCTT AAGGTGTCTC TTTCTATGAA 

50 

TCGTGCTTCA ATTTGTTCTT TACTTATTAG 
TGCTCCCATT GGTGTTTTCG TTTCGTCCAT 

55 



TTCAAACAAA TcAAATGATG CyTGTTCAAA 1260 

TTCaACACTT aAGTTTAAAT TTTCTTGATT 1320 

AATTTGATAT CGATGATtTT TCACCAGCAG 1380 

CTCTGCTAAT AACTTTTTCA GGTAAATCAG 1440 

GTCAACTGCA CCATCTTTGA CTTTATGCAA 1500 

AGCGACGTGA ACATTTTTTA GACTTGGTAA 1560 

ATGTGTTGAA AATAACGTTT TAGCATGTGA 1620 

CGCTAAAGCT AAACOGTCAT ACGTTGAAGT 1680 

ACTATCCTCT GTTGCATAAG TTAATGCCTT 1740 

ACTCTTACCT GAAACCAAAT CATCTGCCGC 1800 

AGGTAACACT GCCTCTTTAC AAGGGACATA 1860 

GGCAACTTGT CTCATATATG TCGATTTACC 1920 

AAATGTTTCA TTATCTAATC GACAATTATT 1980 

TTCCACTACT GGGTGCCTAG ATTCCACTAA 2040 

CCTAGTGTAA TTATATTTTT GAGCAATTTC 2100 

AATAATTTTA GCTTGTTGTT GTAAACGTTC 2160 

AACAAATAAT TGATATTCTA ATTCGATGGC 2220 

TTTTTCTTTA AGTTCATCAG TTATAAAACG 2280 

ATAACCAAAT TCACTTGGTT CAAAATTTTG 2340 

ACCAAACACT TTATTAAAGC TTATTTTCAA 24 00 

GGCTTGTAAT TCTGCTAACC ATGTTTTTCC 2460 

TTGCGTATTA AAACCAACTT TGAATAGTCC 2520 

TACTAAACTC TGTTCTAATA TATCAAGTAA 2580 

TACAAGAGTA TTCTGATTCA TAGAATTTAG 264 0 

GGAATGTTTA AGTTGAATTA AATCTCTCGC 2700 

AAGACGTTCA ATATCATACA CTTGATTAAG 2760 

ATGAGCACTA AATTCATCAA CGATATCTAA 2 820 

TGGTCTATCT ATCCATTGTT TTAAGCGGCG 2880 

TAGCCAAAGT AGCGTTCCTT TTTTTGATTT 2 940 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



ATCT AT AG CT GCATATTGAA CAACATCCTC GATATGCGAT AAATCACOTT TTTGTGTATG 3060 

ATGAATATAA TCTAGCAATA ATTGTGTCGC TTGATACaTT AATTTATGTT CAGTTTGATT 3120 

CACACTATAG ATTtCTGATG ATAACGTTTC CCTGACTGT 3l 59 
(2) INFORMATION FOR SEQ ID NO: 232: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1238 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 232: 

TAAGCGAGAA GCAATTGGTG TTATGTATGC TAGTGATAAA CCAACAGGTG AAAGTACAAG 60 

GTCATTTGCT GTTTATTTCT CTCCTGAAAT TAAGAAATTT ATTGCAGATA ATTTAGATAA 120 

ATAAATCATC CATCCATACA TTGATAAATG ATTTTyAGAA ATTAACAACA AAATCAACAA 160 

TTTTAAACAT CTCTGTGATT CTATTTATTC GAAATGATTT AAAAAATAAA ACTTCAAAAA 240 

CCTAACCTTA TATTTATACG AATACTTAGA GGAGCACAAA AATGAATAAA AATATAATCA 300 

TCAAAAGTAT TGCAGCATTG ACGATTTTAA CATCAGTGAC TGGCGTCGGC ACAACAGTGG 360 

TTGAGGGTAT TCAACAAACG GCTAAAGCTG AACATAATGT GAAACTAATC AAAAATACTA 420 

ATGTAGCACC ATACAATGGT GTCGTTTCGA TAGGATCTGG AACAGGTTTC ATTGTCGGTA 4 80 

AAAATACAAT TGTTACCAAC AAGCATGTCG TTGCAGGTAT GGAAATTGGT GCACATATTA 540 

TAGCGCATCC CAATGGTGAA TATAATAATG GCGGATTTTA TAAAGTTAAA AAAATTGTCC 600 

GTTATTCAGG TCAAGAAGAT ATTGCCATTC TACATGTGGA AGATAAAGCT GTTCATCCAA 660 

AAAACAGGAA TTTTAAAGAT TACACAGGCA TTTTAAAAAT AGCATCAGAA GCTAAAGAAA 720 

ATGAACGCAT TTCAATTGTT GGCTATCCAG AACCATATAT AAATAAATTT CAAATGTATG 780 

AGTCAACAGG AAAAGTGCTG TCAGTTAAAG GCAACATGAT TATTACTGAT GCTTTCGTAG 840 

AACCAGGCAA CTCAGGTTCA GCTGTATTTA ACAGTAAATA CGAaGTtGTA GGTGTTCACT 900 

TTGGTGGAAA CGGCCCTGGA AATAAAAGTA CAAAAGGATA TGGTGTTTAT TTCTCTCCTG 960 

AAATTAAGAA ATTCATTGCA GATAACACAG ATAAATAAAT CCTTACATAG ATAAATGATT 1020 

TTAAAAATTA ACAACAAACT CAACaATTCA AATCATCTCT GTGATTCCAT TTATTCGAAA 1080 

TGATTAAAAA AAATAAAACT TCAAAAAGCT AACATTATAA TTATACAAAT ACTTAGAGGA 1140 

GCAGAAAAAT GaATAAAAAT ATAATCATCA AAAGTATTGC AGCATTGGAC GATTTTTAAC 1200 



55 
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(2) INFORMATION FOR SEQ ID NO: 233: 
(i) SEQUENCE CHARACTERISTICS: 

s (A) LENGTH: 6444 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 233: 





TGATAAGTCA 


TTTAAATTGT 


CACCTATTGA 


CATGACTTCT 


TTCATTTCAA 


TCCCTAATCT 


60 


IS 


TTCGGCAATT 


GTTTCTAGCG 


CAATACCTTT 


TTGTGCATCT 


GAATGCGTTA 


TTTCTATATT 


ion 




TCCTCTCGAA 


GATGATGATA 


TAGCTAAATT 


CGGAGAkTCA 


GCTAAAATTT 


TACTAG CTTT 


inn 




GTCAATTTTT 


TCTAAATTTC 


CATCAAATGC 


TAATATTTTC 


ATAATTAATT 


CACCAGGTAT 




20 


GTTTTCAATA 


GCATCATAAT 


TATCAACAAC 


TyTCAACGTA CCATTATCTA TGCGTCTTTG 


inn 




AATACCATTT 


TTAATACGCT 


CAAOGTTTGC 


ATGTTGACCT 


GCACGCTCAG 


CAATATCTAT 




25 


GTAAATGTCT 


AAATCTCTTT 


GTGGATCTTC 


AGTATAAATC 


GCACGACTCG 


TGTATACTTG 




ATAATAAATA 


CCTGCATCTT 


TTAAAACATT 


TGTAATTTTG 


TGTACTAACG 


ATTTATTAAG 


480 




GTGTGAAGTG 


CTCATTACAT 


TGAAAGTTTC 


ATCACGTACT 


TCAGCACCAT 


TCAAACAAAT 


S4 0 


30 


ATATGGTACT 


GTTAAATCTG 


TGTCAGCAAC 


TGGTGCTTGk 


GCTTCATAAA 


ATGCTCGACC 


600 




TGTCGCGATA 


ACAACCGTTA 


TCCCTTUTTC 


TTGAGCGTAT 


TTAATCGCAT 


CAATATTAGG 


660 




TTGAGAAATT 


TCATGTGCTG 


CATTAAGTAG 


CGTGCCATCC 


ATATCAGTGG 


CTATTAGTTT 


720 


35 


TATCATTATG 


TnACCTCGTT 


TCGTAAATnT 


AAAATCTTGT 


TCTTAAATAA 


G r AT ATAT AC 


780 




TCAGCGCACA 


TACTTTtCTA 


TTAmCATTTA 


TATkGTCATT 


aATTTATCAT 


ATAATGTAAT 


640 




TCTaACAAAT nTTAA t TAG T ATGTACTATC GTCTAATTGG 


TGGATTTCTT 


ATTGGCTCTT 


900 


40 


AAgTTTTTAA AAAATGTTGT 


TAATAATGTG 


CTACATGCTT 


CTTTAAGTAC 


ACCTTTATCA 


960 




ACAATTGCAC 


GATGATTAAA 


ATTAGATTGT 


TGCAATAAAT 


TCATTAAACT 


GC CACTACAA 


1020 


45 


CCACCTTTAG 


GATCATCTGC 


GCCATAGACG 


ACTCTTGGAA 


TGCGACTCAT 


TACAATTGTT 


10B0 


CCTGCGCACA 


TGACACATGG 


TTCTAAGGTT 


ACATATAATG 


TGCAACCTTC 


TAAACGCCAA 


114 0 




CTACCTAACA 


CTTTGGCTGC 


ACGTTCAATT 


GCAATATGTT 


CAGCATGCGC 


CGTTGGTTGT 


1200 


50 


TGTAGTGTTT 


CTCTTaAATT 


ATGTGCTCTA 


GCGATAACTT 


CATCATCTTT 


AGTGATGATA 


1260 




GCACCTATAG 


GTACTTCGCC 


TAGTTGAGCT 


GCTTTTTTAG 


CTTCTTCAAT 


CGCTAATGTC 


1320 




ATAAAATATA 


TATCATTTGT 


CATTTATGTC 


CAGATACCTC 


ACTTATGGTA 


CAATACTCAA 


1380 



55 
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CTATTGGCGT AGGTAAATCT TCACTTGCAC 
AAGAAAAAGA AATCATCACA GAAAATCCAT 
5 AATGGAGTTT TCAAACTGAA ATGTTCTTTT 

TAACACAACT AAATCAAGGT GTAGTTAGTG 
CTAAAAATAC TTTGAGTTCT GTTGAATTTC 

10 

CTGAAGATAT GATTATGCCG AATATGATTA 
AATCTAGAAT TGCTAAACGT AACCGTAGTT 

1S TTAAAAAAAG ATTATCGTGA GTATTATGAG 

TTAATCGATA CnACTTCTAT TGATTTTCTT 
CATATTATAT TACCTATGAT AGGAGATATT 

20 TGCCATTATA ACCATTGCAG GTACAGTTGG 

TGCAGATAAA TTAAACTTTA AAACGT C TTT 
TAAATTTTAC AGCGATTTTG AACGATGGAG 

25 ACGTTTTAAA GAACAAAAGC GTATGTTTGA 

AATTTATGAA GATGTTGATA TTTTTGCAAA 
AGAAGATTTC AAAACATATT CAGACTTATT 

30 

TAAACCTGAT GTAATGATTT ATTTAgAATG 
TGAACGTGGT CGCGAAATGG AAATTAATAC 

35 ACGCTATGAC GATTGGATTA AT AG CTTT AA 

TGAATATGAT ATCCATAAGG ACCCCGAATC 
AATTATTCAA ACATATCGAC AAGTAGATAC 

40 GTTTATATTC AATGTATATT CCATAGATAT 
CATTAATTCA CATATACACT ATGTCTTTCT 
GCACTATTTA AAATAATATC AGCTTCATGT 

45 ACACCTATTG CCATACCTAA ATTTGCATTA 
CCTACTATAG CTACTTTCTG AGGATCTACA 
TTAGGATTTG GCTTCTCATA GGCATCCGCT 

50 

GTAGCATTGG TATGTGCTAA AAATTGTTCT 
CCAAGTTGAT AGCCTTTTGC TTTCAAATCG 

55 



ACAAATTAAG TCAAACTTTA GATTTTTATG 1500 

TTTTATCAGA CTTTTATGAA GATATCTCTA 1560 

TATGCAATAG ATATAAGCAA TTTCAAGATG 1620 

ATTATCATAT ACATAAAAAT AAGATATTTG 1660 

AGAAATTCAG TAAAATTTAT GATATTTTAA 174 0 

TCTTTTTAGA TGCAGACCTT GATGTGTTAA 1800 

TTGAGCATCA AATAGAaGtG AtAcTGTaAg 1860 

TCCTTACAAA GTAATGGTTC AAATGTAGTT 1920 

AAAAATGAAC AAGATTACGA AGATATATTA 1980 

ACCAATGAAT AATTACGGTA TTCCACAAAA 2040 

TGTTGGAAAA TCAACACTAA SGCAAGCACT 2100 

TGAAAATGTC GAACATAATC CATATTTAGA 2160 

TTTCCATTTG CAAATTTACT TCTTAGCTGA 2220 

ATATGGTGGT GGCTTTGTCC AAGATCGATC 2280 

AATGCATGAA GAAGAAGGCA CAATGAGTAA 2340 

TAATGC CATG GTCATGACAC CTTATTTTCC 2400 

TAACTATGAT GAGGTCATTG ATCGTATTAT 2460 

AGACCCTGAA TACTGGAAAA AGCTATTTAA 2520 

TGCATGTCCA GTTGTACGTA TCAATATTAA 2580 

TTTAAATCCT ATGATAAACA AAATTGCTCG 2640 

ACGATAAAAG ACTAAAGACA TAGCGTATAT 2700 

TATCGATTAT TTTATCAATT CTATCGAATA 2760 

TTTTAATTTA AAGCTTCTAA AATATCTGCC 2820 

AATTCTTCTT TTGTTGCAAT ACCTGTTAAT 2880 

CTTGCTGTCT TCATATCATT AGCAGTGTCT 2940 

TTATATTGCT CAAATAAAGG CGATAATACT 3000 

TCGGTAGAAA TGATCAAATC GAACAACGAG 3060 

ACACCTTTTT TAGTATCACT CGTAACAATA 3120 

ATAAGTGCTT CTTTAACACC TTCTACCCAA 3180 
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GTATCTTGTC CCGTCACATC ATTAAATOCC TGGATAATTT GTTOTAAAGA TCCTGAACCC 3300 

ATCACTGATT TTGGATCAAT AGATTCTTTA ATGACACCGA GTTGTCTTAA AGCAGCTTCT 3360 

S 

TTATTATGTA CTGGGAAAGT CTCAAGCAAT GATTGTACAA ATCGTACCCC TATTTTTTCC 3420 

CAACTTCTAT CAAATTCAAT TAAOGTACCA TCTTTATCAA ATAATATCCA TTCCATTGaT 34 80 

ATCAATACTC CTATTTATTT ATTTCGTATT ATGCTGATTC TATGATATTC GTTATCCCCT 3540 

10 

GAAAATGAAC TCGTAGTATT GTTCTATTTA AATATTGaAT TAAATATAAT AATAAGTGAA 3600 

ATCCCCTTCA ATACTTAACA ATAAACATTG TAAACTTAAT TTATTACCAT GCTTCGCTTC 3660 

1S ATTGAAAGGG ATTTTAGTCA TGATTAACTT TTGCATATTG TTTTCATGAT TATATTCAAT 3720 

TTTTATTAAT ATTTTGGTAC AACGACTCTC CAACCATTTT TATCTTCTAA AGTACCATTT 3780 

TGAATACCAG TATAGACGTC GTATAATTTT TGAGTAATTT CACCAGTCTC ATTATTATTA 384 0 

20 ATAACGATTT CACGATCTTC GTATCTCAAT GTACCCACAG GTGAAATAAC TGCTGCAGTA 3900 

CCACTACCAA ATACTTCTGT TAACTCACCT TTATCATATG ATTCGAATAA TTCATCGATT 3960 

GAAACGCGGC GCTCTTCGAC TTCATATCCT AAGTTTTTAG CTAATTCGAT AATAGATTTA 4 020 

25 

CGTGTAATAC CAGGTAAAAT ACTGCCATTC AACTCTGGTG TAATTACTTT GCCATTTTCA 4060 

ACGAAGAAAA TGTTCATGCT ACCAACTTCT TCGATATATT TCTGTTCAAC ACCATCAAGC 414 0 

CATAATACTT GGTCATAACC TAATTTATTT GCATTAGTTT GTGCTAATAA ACTTGC CGCA 4200 

30 

TAGTTACCTG CAACTTTTGC AAAGCCTACA CCGCCACGaA CAGCACGCAC ATATTCATCT 4260 

TCTACATAGA TTTTAGTTGG TTTTAAAGTT TCACCACCAT AATATGCACC TGAAGGAGAT 4320 

3S AAAATAATTA ATAATTTATA CTGATGTGAT GCACCAACGC CAAGTGCCCC TTCTGTTGCA 43 80 

AAAACAAATG GACGAATATA TAATGATTGA CCTTCCCCTT CAGGAATCCA ATCTCTTTCA 4440 

ATATCAACTA ATTGTTTTAG CCCCTCTAAC AATTCTGCTT CGTCTACTTG AGGCATTTCT 4 500 

40 AATCGTGCTA ACGAGTTATT AAGACGCTTA AAATTTTCTT GAGGACGGAA AAGTGCAACT 4 560 

TCCCCATCTC TTTTATATGC TTTTAATCCT TCGAATACCG ATTGACCATA ATGAACACCT 4620 

TGTGCAGCAG GTGAAATTTC AATAGGACCA TAAGGTACTA TCTTCAAATC ATGCCATCCT 4680 

45 

TTATCTGCAT CATAATCATA ACTCAACATA TAATCAGTAA AATATTTACC AAAACCTAGT 4740 

TGAGATGTAT TTGGTTTTTG TTTTAATGTT TCTCGTCGTT CAACTTTAAC TGCTTGTGAC 4 800 

ATGGTGATTG CCTCCTAATA ATATTGTATA AGAATTTGTT TAACTTAAAT TATAACAATC 4 860 

60 

CaTATTTTGC TGTTCAACAA ATTTTCTAAA AATTCAAAAT TAATTAACAG ATTTCTAGAA 4 920 

AGACTATATC TTTTAGTATA AACGTATTAA TTTCACAGAG ACAAGTAATC TGTGTTTTAC 4 980 

55 
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TAAGTATAAT GAATAATATT AGAATTCATG CACTAGTTTA TTAAAATAAA GAGTAATTTA 5100 

AAATATCATT CCGTGTATTA AAGTGAATGG AAATGATTAG TTATTATTTT TAACAGTATC 5160 

5 TTTTTGTTCA ATAGCTTCTA ACATTAATTT AGTCATGCTC GCTAAATCAT ATTTAGGATC 5220 

AAATCCCCAT TCGCCACGTG AACAGCTTGT ATCAATAGAA TCCGGCCAAC TATTAGCGAT 5280 

ACCTTGTCTA ATAGGATCAA CATCGTAATC TAATGTAAAA TTGGGATAGT ATTCTTGAAT 5340 

10 

TGCTTCTTTT ACCATCTCTG GATCAAAACT CATTGCGCTC AAATTATAAC CATTTCTAGT 5400 

TTCTAATTTA GOGTCGTCTG CTTCCATAAG TTTAATAATT GCTTCAATTG CATCATCCAT 5460 

ATACATCATA TCCATATACG TGCCTTTATC TATGAAGCTT GTATAATGAC CCTCTCTTAC 5520 

15 

TGCTTTGAAG TATATTTCAA CAGCATAGTC TGTAGTACCG CCACCTGGCT CTTTAACATG 5580 

CGAGATTAAA CCTGGGAATC TAACACTTCT TGTATCTACA CCAAAACGTT TGAAATAGTA 5640 

20 TTGACACAAT AATTCTCCAG CTACTTTATT TACACCATAC ATTGTCGTAG GTTGCTGAAT 5700 

CGTTACTTGT GGOGTATTAA CTTTAGGAGT TGAGTCTCCA AATGCACCAA TTGAACTTGG 5760 

TGTGAAAAAG TGCAAATTAT AAGTTCTTGC AGCTTCTAAT GCATTCATTA ATCCACCCAT 5820 

25 ATTTAAATCC CAAGCTAGAA TTGGATTTTT CTCAGCAGTT GCTGATAATA ATGCTGCCAT 5880 

ATGCATTAGA CTATCCGCTT CAAAGTCCCT AACTAACTCA AACATACGGT CACGATCTGT 594 0 

TACGTCTAAG ATTTCAAATG GTCCATTTTG TACAGGTGAG TCTGCTTCAG GTTCCCTAAT 6000 

30 ATCTGTAGCA AGAACATTAT CTGT CC CAT A AATTTCTCTG CACTTAACAA CTAATTCTGT 6060 

ACCAATTTGT CCTAATG CAC CAGTAATCAT AATTTTTTTC ATAGAAATAT CTCCTTTGtC 6120 

TCTTCTATAT AGCTATAGTC CATCACAAGC GGaCATAATA TTCATTTTCA TAATAATTAT 6180 

35 

AATATAAAAG CGCTTTCTTG TATATATGAC ATGTACATGT TGCTGATATk TCTGTAAATG 624 0 

GAAATTCTAG TTGTATTAAT TGATTTTAGT AATTTATAGC GTTTATTATT GCTAATTACT 63 00 

GtCAAATTAA ATTTTTTATC CCTCAACTCT TAAACTCTGG ATATCTTTCA TTATATTAGC 6360 

40 

TTTTTTATAA CCATGGATAT CATGTAAAGC CTTATAAGCn TTAAATAATG TTTCATACCT 6420 

TTGTACTTnT TCCGCTTCTG GATT 6444 

45 (2) INFORMATION FOR SEQ ID NO: 234: 

{i) SEQUENCE CHARACTERISTICS : 

{A) LENGTH: 4721 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

60 (D) TOPOLOGY : linear 
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GCCCATGAGA CAATTTTACT TGCTTTTCCC ATTGGTTATC ACGTTCTTAT TACATAGATT 60 

TAAACCGAGA AATATTATTC AAACGCTATT TATTGTATCG TTGATTTCTT TAGGACTTAT 120 

5 GATAGTGATT CATTTCATCA CTGGAGATAA TTCACGTGTG TATTTTGGGA CAGATACACG 180 

ACTGCAAACT TTATTGCTTG GTTGTATATT AGCATTTATT TGGCCTCCGT TTGCTTTGAA 240 

AAAAGATATT TCTAAAAAGA TTGTCGTATC ATTAGATATT ATAGGGATAT CTGGTTTTGC 3 00 

10 

GGTTCTAATG ACTTTGTTCT TTATAGTTGG AGACCAAGAT CAATGGATCT ATAATGGAGG 360 

ATTTTACATT ATATCATTTG CAACTTTATT CATTATTGCA ATTGCGGTAC ATCCTTCTAG 420 

TTTATTTGCT AAATTTTTAA GTATGAAACC TTTACTAATT ATAGGTAAAC GATCATATAG 4 80 

IS 

CTTATACTTA TGGCATTATC CTATCATTGT TTTTGTGAAC AGTTATTACG TACAAGGACA 540 

AATACCGGTA TACGTTTATA TTATAGAAAT TTTGTTAACA GCGTTAATGG CTGAAATTTC 600 

20 GTATCGCTTT ATTGAAACAC CTATACGTAA AAAAGGATTT AAAGCTTTTG CATTTTTACC 660 

TAAAAAGAAG GGGCAATTTG CTAGAACAGT GTTAGTTATC CTATTATTGG TTCCGTCTAT 720 

CGTTGTGCTC AGTGGACAGT TTGATGCACT TGGCAAACAA CATGAAGCOG AGAAGAAAGA 780 

25 GAAGAAGACG GAATTTAAAA CAACGAAGAA AAAAGTCGTT AAAAAAGATA AGCAAGAGGA 840 

TAAGCAGACA GCGAATAGCA AAGAGGATAT TAAAAAGTCA TCACCACTAT TAATTGGTGA 900 

CTGGGTCATG GTGGATATTG GTAATGTCTT TACTAAGAAA ATACCAAATG CACAAATTGA 960 

30 TGGTAAAGTT GGACGGCAAC TCGTTGATGC TACACCAATT GTGAAATCGC AATATAAAGA 1020 

CTATGCTAAA AAAGGTCAAA AAGTTGTAGT AGAGCTTGGT ACAAATGGGG CATTTACGAA 1080 

AGATCAATTA AATGAACTAT TGGATAGTTT TGGAAAAGCA GACATATATT TAGTTTCTAT 1140 

35 

TAGAGTACCT AGAGATTATG AAGGTAGAAT AAATAAATTA ATTTATGAGG CAGCTGAAAA 1200 

G OGCTCTAAT GTACATCTAG TCGATTGGTA TAAAGCTTCT GCAGGTCATC CGGAATACTT 1260 

TGCATATGAC GGTATTCACT TAGAATATGC AGGTAGTAAA GCGCTGACTG ATTTGATTGT 1320 

40 

AAAAACGATG GAAACACATG CTACAAATAA GAAATAATTT GATGCACTAA ACTTTTGAAA 1380 

TATTACATTA CTTCTGATAT TTATTATCAA AAATGATGTA TTTCATTAAA AGTTTAGTGC 1440 

45 TTTTTTATTT TCAAATCCCA TAGTAACGGT GCAGAAAAAG TGTTGTAAAC ATTCTAATTG 1500 

GTATATTACA TTCAATGAAG CTTTATTAGG AACAGATTAC ATTATGATAA CAAAGCCCGC 1560 

AAGACACCTA ATCTCTGTTA TAGTTTGTTT TGTCGCAAAA CTATAAAAGT TATAATTGTT 1620 

50 TGCATACTAA AAAAATAAAA AATATAAAAT TTAAAATAAT TGAGTCGCTA ATGACTATAT 1680 

GTATAGAGTG TTTTGATTAT TGGGAGGATA TTTAATTATG AAAAAAATCG TTACAGCTAC 1740 
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ACAAAATAAC 


AATGGATATA ATTCTAATGA 


CXjCTCAATCA 


TACAGCTATA 


CGTATACAAT 


l ft en 




TQATGCACAA 


GGTAATTATC ATTACACTTG 


GACAGGAAAT 


TGGAATCCAA 


GTCAATTAAC 




S 


GCAAAACAAC 


ACATACTACT 


ACAACAACTA 


CAATACTTAT 


AGTTATAACA ATGCATCTTA 






CAATAACTAC 


TATAATCATT 


CATATCAATA 


CAATAACTAT 


ACAAACAATA 


GTCAAACAGC 






AACAAATAAC 


TATTATACTG 


GTGGTTCAGG 


TGCAAGTTAT 


AGCACAACAA 


GTAATAATGT 




10 


TCATGTGACT 


ACAACTGCAG 


OGCCATCTTC 


AAATfSCTffiT 


TCAATTTCTA 


ATGGTTATGC 






ATCAGGAAGT 


AACTTATATA 


CTTCAGGACA 




TATGTATTTG 


ATCGTGTTGG 




IS 


TGGGAAAATT 


GGTTCAACAT 


GGGGTAACGC 


AAGTAATTGG 


GctAACGCAG 


CTGCATCATC 




TGGCTATACA 


GTGAACAATA 


CACCAAAAGT 


XVJV3 AvJV* X AX V~ 


ATGCAAACAA 


CACAAGGCTA 








GTTGCTTACG 


TTGAAGGCGT 




GGTTCTGTTC 


GTGTTTCAGA 


24Q0 


20 


nnlwinv xnx 


GGACATGGTG 


CTGGTGTGGT 


TACGTCTCGT 


ACAATTTCAG 


CAAACCAAGC 


2460 




WNl Iwtlni 


AATTTCATTC 


ATTAATCAAA 


lulnnniUvi 


ATGACGTCAA 


TATTCTCTAA 


2520 






TTGGOGTTTT 


TGTTTTATAT 


AAA1A1AAAX 


GAGAGCGGTT 


TATTCACTGA 


2580 




TCTTTAGGGA 


ACTAAGTAAT 


AAAGTGATAA 


TTTATACTAT 


GTCAGTATGA 


TTGAGAGTGA 


2640 




TTCAATTTAG 


ATGAAAACCA 


TGAAAAAATA 


TA 11 AAAACA 


GCATTTTTTT 


GTAGTATGTA 


2700 




TTGGTTAATT 


GTTCAACTAA 


ATATAGCAAA 


X X 1 AGGTACA 


AGAATTCCTG 


ATAAGTATTT 


2760 


30 


TCGTCA6AAG 


TACATAATAT 


TTAAATCATT 


TAACTTTGAG 


AAGCATGGAA 


AATTTTGGAA 


2820 




CAAATGGTTT 


TACGTAAGAA 


AATGGAAACA 


TAAGATTTTA 


GATGGTCATC 


AGCTTAATCA 


2880 


35 


AAATATATAT 


GATCAGCGTC 


ATTTAATGAC 


AATCAATACT 


GATGAAATTG 


AAAAAATGAT 


2940 


TATAGAGACA 


AAGAGGGCAG 


AGTTGATTCA 


TTGGATATCG 


ATACTT CCAG 


TCATCATATT 


■a n a n 
J UyU 




CAATAAAGGC CCTCGTTTAG TAAAGTATAT AAATATTTTC TATGCAATGA TAGCTAATGT 


JUoU 


40 


TCCAATCATT 


ATTGTGCAAC 


GCTATAATCG 


ACCGAGATTA 


ACGCAGTTAC 


TACGCATATT 






AAAACGAAGA 


GGTGAACGTC 


ATGACTAAAC 


ATATCATCGT 


TATTGGTGGT 


GGCTTAGGTG 


1 fin 




GGATTTCTGC 


AGCAATTCGA 


ATGGCACAAA 


GTGGCTATTC 


GGTCTCATTA 


TATGAACAAA 




4$ 


ATAATCATAT 


AGGAGGCAAA 


GTGAATCGTC 


ATGAATCAGA 


TGGCTTTGGC 


TTTGATTTAG 


3300 




GTCCATCTAT 


TTTAACGATG 


CCTTATATTT 


TTGAAAAATT 


ATTCGAATAT 


AGCAAGAAGC 


3360 




AAATGTCAGA CTACGTTACA ATCAAGCGAT TGCCACATCA ATGGCGTAgC 


TT1TTTCCAG 


3420 


SO 


ATGGAACGAC 


TATCGATTTG 


TATGAAGGTA 


TTAAAGAAAC 


AGGTCAGCAT 


AATGCGATAT 


3480 




TGTCGAAACA 


GGATATAGAG 


GAACTGCAAA 


ATTATTTGAA 


TTATACAAGA 


CX3AATCGATC 


3540 
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TTCATGGGCC 


ATTAAATGCT 


CTTATTAATT 


ATGATTATGT 


ACATACTATG 


CAACAGGCCA 


3660 




TAGACAAGCG 


TATCTCGAAT 


CCATACTTGC 


GACAAATGTT 


AGGCTATTTT 


ATCAAATATG 


3720 


5 


TAGGTTCTTC 


ATCATACGAT 


GCGCCAgCTG 


TATTATCTAT 


GTTATTCCAT 


ATGCAACAAG 


3780 




AGCAAGGCCT 


TTGGTATQTA 


GAAGGTGGAA 


TCCATCATTT 


AGCCAATGCC 


TTGGAAAAGC 


3840 




tAGCGCGTGA 


AGAAGGTGTC 


ACAATTCATA 


CAGGTGCACG 


TGTGGACAAT ATTAAAACAT 


3900 


m 

JU 


ATCAAAGACG 


TGTGACGGGT 


GTCAGATTAG 


ATACAGGTGA 


GTTTGTAAAG 


GCAGATTATA 


3960 




TTATTTCAAA 


TATGGAAGTC 


ATACCTACTT 


ATAAATATTT 


AATTCACCTT 


GATACTCAAC 


4020 


15 


GATTAAACAA 


ATTAGAGAGG 


GAATTTGAGC 


CGGCAAGCTC 


AGGATATGTG 


ATGCATTTAG 


4080 


GTGTTGCTTG 


CCAATACCCG 


CAATTAGCAC 


ATCATAATTT 


CTTTTTTACG 


GAAAATGCTT 


4140 




ATCTCAATTA 


TcAACAAGTT 


TTTCATGAAA 


AGGTATTGCC 


AGATGATCCG 


ACCATTTATC 


4200 


20 


TAGTAAATAC 


GAATAAAACT 


GATCACACAC 


AAGCGCCAGT 


AGGTTATGAA AATATCAAAG 


4260 




TCTTACCACA 


TATTCCATAT 


ATTCAAGATC 


AGCCTTTTAC 


CACTGAAGAT 


TATGCGAAGT 


4320 




TTAGGGATAA 


AATTTTGGAT 


AAATTAGAAA 


AAATGGGACT 


TACTGATTTA 


AGAAAACACA 


4380 


25 


TTATTTATGA 


AGATGTTTGG 


ACACCGGAGg 


ATATTGAAAA 


AAATTATCGT 


TCTAATCGTG 


4440 




GTGCAATATA 


TGGTGTTGTA 


GCAGATAAAA 


AGAAAAACAA 


AGGATTTAAA 


TTTC CTAAAG 


4500 




AAAGTCAGTA 


TTTTGAAAAC 


TTGTACTTTG 


TAGGTGGATC 


AGTAAATCCT 


GGTGGTGGCA 


4560 


30 


TGCGAATGGT 


TACATTAAGT 


GGGCAACAAG 


TCGCAGcAAg 


ATAAACGCGC 


GAGAAGCGAA 


4620 




GAATAGGAAG 


TGATATCTAT 


GAAATGGTTA 


TCACGAATAT 


TAACAGTAAT 


AGTGACCATG 


4680 




TCTATGGCGT 


GTGGTGCaTT 


GATATTTaAT 


CgTAGACATC 


A 




4721 



35 

(2) INFORMATION FOR SEQ ID NO: 235: 



(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 3516 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 235: 

TATTCGTGCG CAATGGGCTA AATTAGGTCT AGGTTTAGAT TATAGTAGAG AACGTTTTAC 60 

TTTAGATGAA GGTTTAAGTA AAGCAGTTAA AAAAGTTTTT GTTGATTTAT ACAATAAAGG 120 

AATTATTTAT CGTGG CGAAC GTATTATAAA TtGGGATCCn AAAGCACGTA CAGCTTTATC 180 

TGaTATTGAA GTAATACATG AAGATGTTCA AGGTGCGTTT TATCATTTTA AATATCCTTA 240 
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TACAGCGATT GTTGTTAACC CTAATGACGA ACGATACAAA GATGTAATCG 


! GTAAAACTGT 


360 




TATATTACCA ATCGTAGGAC 


GCGAACTGCC 


TATTTTAGCA 


GATGAGTATG 


TTGATATAGA 


420 


5 


CTTCGGTTCT 


GGTGCTATGA 


AAGTGACACC 


AGCACATGAC 


CCTAATQATT 


TTGAAATTGG 


480 




TCAAAGACAT 


CAATTAGAAA ATATTATCGT 


TATGGATGAA AATGGTAAAA 


TGAACGACAA 


540 




AGCGGGTAAA 


TATGAAGGTA 


TGGACCGTTT 


TGATTGTCGT 


AAACAGCTAG 


TTAAAGATTT 




10 


AAAAGAACAA 


GATTTAGTTA 


TCAAGATTGA 


AGATCATGTT 


CATTCTGTAG 


GTCATTCAGA 


O O \J 




ACGATCTGGC 


GCTOTTGTTG 


AACCATATTT 


ATCAACACAA 


TGGTTTGTGC 


GCATGGAAGA 


/ « u 


15 


CTTAGCGAAA 


CGTTCATTAG 


ATAACCAAAA 


AACAGATGAT 


CGTATTQATT 


TTTATCCGCA 


/ DU 


ACGTTTCGAA 


CATACATTTA 


ACCAATGGAT 


GGAAAATATT 


AGAQATTGGA 


CGATTTCAAG 


a a r\ 




ACAATTATGG 


TGGGGTCATC 


AAATTCCGGC 


TTGGTATCAT 


AAAGAAACAG 


GCOAAATATA 


900 


20 


TGTTGGAGAA 


GAAGCGCCAA 


CTGATATTGA 


AAATTGGCAA 


CAAGATGAAG 


ATGTATTAGA 


960 




TACGTGGTTC 


TCaAGTGCTT 


TATGGCCtTT 


CTCyACGTTA GGTTGGCCTG ATTTAGAAAG 


1020 




TGAAGACTTT 


AAACGATACT 


ACCCAACAAA 


TG CCTTAGTT 


ACAGGTTACG 


ATATTATCTT 


1080 


25 


TTTCTGGGTA 


GCACGCATGA 


TATTCCAAGG 


CTTAGAATTT 


ACAGATCGTC 


GTCCATTTAA 


1140 




TGATGTATTA 


TTACACGGTT 


TAGTTCGTGC 


TGAAGACGGG 


CGTAAGATGA 


GTAAATCATT 


1200 




AGGTAATGGT 


GTGGATCCAA 


TGGATGTTAT 


TGAOGAATAC 


GGTGCTGATA 


GCTTGCGTTA 


1260 


30 


CTTCTTAGCA 


ACAGGTTCAT 


CTCCAGGACA 


TGATTTAAGA 


TACTCAACTG 


AAAAAGTTGA 


1320 




GTCAGTGTGG 


AACTTTATCA 


ATAAAATCTG 


GAATGGGGCA 


CGTTTCAGTT 


TAATGAATAT 


1380 


35 


CGGTGAAGAC 


TTTAAAGTTG 


AAGATATCGA 


TTTAAGTGGT 


AACTTATCAT 


TAGCAGATAA 


1440 


ATGGATTCTA 


ACACGTTTAA 


ATGAAACGAT 


TGCAACAGTT 


ACTGATTTAA 


GTGACAAATA 






TGAATTCGGC 


WV1VJ A A wwA^ 




TAATTTCATT 


TGGGATGATT 


TCTGTGATTG 




40 


GTACATTGAA 


ATGAGTAAAA 


TTCCAATGAA 


TAGTAATGAT 


GAAGAACAAA 


AACAAGTTAC 






ACGTTCAGTA 


TTGAGTTATA 


CTTTAGACAA 


TATTATGAGA 


ATGCTACATC 


CATTCATGCC 


1680 




ATTTGTAACA 


GAGAAAATAT 


GGCAAAGTTT 


ACCACATGAA 


GGTGACACAA 


TTGTTAAAGC 


1740 


45 


TTCATGGCCA 


GAAGTGCGTG 


AATCATTGAT 


TTTTGAAGAA 


AGTAAACAAA 


CAATGCAACA 


1800 




ACTTGTTGAA 


ATCATTAAAT 


CTGTAAGACA 


ATCACGTGTA 


GAAGTAAATA 


CGCCATTGTC 


1860 




TAAAGAAATA 


CCTATTTTAA 


TTCAAGCTAA 


AGATAAAGAA 


ATTGAAACAA 


CTTTATCACA 


1920 


50 


AAACAAAGAT 


TATTTAATCA 


AATTCTGTAA 


TCCTAGTACC 


TTAAATATTA 


gCtGACGTCG 


1980 




AAAwTCCTGA 


GAAAGCAATG 


ACaTCAGTTO 


TAATTGCAGG 


TAAAGTGGTA 


TTACCATTAG 


2040 
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AAAGCGAATT AGATAGAGTA GATAAAAAGC TCTCTAATGA AAACTTTGTA AGTAAAGCAC 2160 

CTGAAAAGGT TATAAATGAA GAAAAACGTA AAAAACAAGA TTATCAAGAA AAATATGATG 2220 

5 

GTGTGAAGGC AAGAATTOAA CAATTAAAAG CATAGGAGTT AGTAACAATG AATTACCTAG 2280 

AGAGCTTGTA TTGGATACAC GAAAGAACTA AATTTGGCAT CAAACCAGGT GTTAAACGTA 2340 

TGGAATGGAT GCTAGCACAA TTTAATAATC CTCAAAATAA CATTAAGGGT ATTCATGTAG 2400 

10 

GTGGCACAAA TGGTAAAGGC TCTACAGTTG CTTACCTTAG AACAGCTTTA GTTGAAAATG 2460 

GTTATGAAGT AGGTACATTT ACGTCGCCGT TTATTGAAAC ATTTAATGAA CGAATTAGTC 2520 

1S TAAATGGTGT GCCAATATCA AATGACGCTA TTGTAGAATT AGTATCACGT ATTAAACCAG 2580 

TAAGTGAAAT GATGOAACOT GAAACAGATT TAGGTGTTGC AACTGAATTC GAAATAATCA 2640 

CAGCGATGAT GTTTTTATAT TTTGGTGAAA TACATCCTGT TGATTTTGTC ATTGTTGAGG 2700 

20 CTGGATTGGG TATAAAGAAC GATTCGACAA ATGTCTTTAC ACCGGTTTTA TCAATCTTAA 2760 

CTAGTATCGG TCTAGACCAT ACAGATATTT TAGGTGGTAC TTATCTAGAT ATTGCTAGGG 2820 

ATAAAGGCGC GATTATAAAG CCTAACGTTC CAGTGATATA TGCTGTTAAA AATGAAGATG 2880 

25 CATTAAAATA TGTTCGTGAA CGCGCAATTG AACAACATGC AAAGCCAATT GAATTAGATA 2940 

GAGAAATTGT TGTTGTATCG CAAAATGATG AATTTACTTA CCGTTATAAA GATTATGAAT 3000 

TAGAAACAAT CATTTTAAGC ATGTTAGGTG AACATCAGAA ACAAAATGCT GCATTAGCCA 3060 

30 - , ■ 

TAACAGCTCT TATTGAATTA AATGAACAAG GATTAATTGA ATTAGATTTC AATAAGATGA 3120 

TAGACGGTAT TGAATCAGTT CGTTGGACTG GACGTATTGA GCAGGTG CAT GACAAACCTT 3180 

TAATCATTTT GGATGGCGCA CATAATTCAG AGAGTATAGA TGCTCTAATT GATACAATTA 324 0 

3S 

AACAGTACCA TGATAAAGAA AAAGTAGATA TTTTGTTCTC AGCAATAAAC GGAAAACCGA 33 00 

TTAACGAGAT GGTCAAACAT TTAAGTTTAA TTGCGCATAC GTTTTATGCA ACTGAATTTG 3360 

40 ATTTTCCGAA AGCGTTACGC AAAGAAGAAA TTGTAGGTAG TATTGAAAAT GATGAAATAC 3420 

AATTAGTAGA TGACTACGTT GAATTTATAA AAAATTATCA AGGTGATACA TTAGTAATTA 34 80 

CCGGTAGTCT GTATTTCATA AGTGAAGTTA AATCAA 3516 

45 (2) INFORMATION FOR SEQ ID NO: 236: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 74 81 base pairs 

(B) TYPE: nucleic acid 
60 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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10 



is 



20 



2S 



30 



35 



40 



45 



50 



TGAGTGATAG AATCAAAAAA OCCATCTCAA 
ATGsTCGCAA ATCACCAATG TATCACTCTC 
TAGTTATTGA GGTTTTGTGA TATATAGTAT 
AAAATTCATm TTCgGGGTCG GGTGTAATTC 
GCTAGTATGT ATCATATTAG TGGCTGATCT 
GGATGGGAGA AGATGGAGGT TTTTTGTTGT 
TGGAAGGAGA AAATTGAATA TGCAACAAAA 
CGCGATTGCG TTTGTGTTAA CTTTTATCAA 
AACTTTAGAT TTTAGTGATG TACCGTCACT 
CGGTATCGTA GTTGCACTGG TTAAAAATTT 
AGTTGGACCA TTTGCTAACT TTTTAGCAGG 
CTATAAAAAT AAACGTTCAA CAAAATCTTT 
TATGACTATC GTGTTGAGTA TTTTGAACTA 
ATTTAACTTA GCTGATATOG CAAATAATCT 
ATTCAATATT ATTAAAGGTA TCGTTATTTC 
TGCGAATTTC TTGAAAAGAA TTTAATCAAA 
AAAAGCAGGT GACTATCAAT AAACGATAGC 
AAAAAATCAA TTATTCaAAT TTTAAAGCGT 
TAGAATCTGt AGGG CATCCa TCAATTGCAT 
CTTCTGCAGT ACCTTGGTTA TCGTCAAGGA 
CATATATATC TGGCGCTGCT GCACCGcATG 
OGATTGTATA TTTTGCCAAT GTCTTCGCCT 
GACTAAAATT TTAGACAGCA TCATTTTTAT 
TTAAATTTGC AACACATTAT AAAAACAGCA 
AAAAGTATTT ACAATATCTT AGTTGGTAAG 
AGTCAACAAC AGTTGTCATT ATATCACAGT 
CTATTTtTAG AAAAAATCAA TGAATTTAAT 
TATACATTTG aAAGCATGGG GCAAACATTT 
TCTAATACCA AACAACATGT TTTTCATTTT 



AAATTAATCA AGCAAACAAC 
CAATTACGTA ACTATGATTT 
AAAATTAATG AGAATTAAAT 
CCAACCGGCA GTAAATAAAG 
AGTGAGATTC TAGAGCCGAC 
GCAATAATCC TCCTATTCTT 
TAAACGTCTT ATCACAATAA 
GTTTCCTATA CCATTTTTGC 
ACTAGCTACA TTTACGTTTG 
ATTGAACTAC TTATTTAGTA 
CGCAAGTTTC TTATTAACTG 
GATTACTGGA TTAATCATTG 
TTTCGTTCTA TTACCTTTGT 
TAAAGTAATC ATTGTTTCAG 
TATTGTATTT ATTTTACTAT 
TTAAAGCAAA ATAATATACA 
TTGCCTGCTT TTTCTATAGA 
CCCCATCAAA. TGATTCGTCT 
CTTCCATATC TTCATATAAT 
TTACGAAAGC AATACCTTCG 
CACCACATGC AATACAAGTA 
CCTTTGATAA AAATGCTAAA 
TTTCAAATTA TCCGTTTTAC 
TTACAACAAA CATTTAACTA 
AAATCTCACC AAACCTTTTT 
TTACCACTAT TAAAATATCC 
GCTGAAATGG AAATCATGTT 
CAAGCAATTC AACTATTAGT 
GTACCAATCT CTCAAAATAA 



ATTCCAAACA 
AATTTAAGCA 
TTAATAATGT 
CCTGCGACCT 
AGTATAGTCT 
ACGAGATGAA 
GTATGTTGAG 
CACCATACTT 
GACCAGTTGC 
TGGGOGATCC 
CTTACGCCAT 
CAACAATCGT 
ACGGTATGAT 
GAATTATACC 
ATAGAAGGCT 
CATAATAATA 
ACATTTGTCT 
-GCAATTTTAA 
TCCC CAGGT A 
TCGTCGTAAT 
TCCATATCAA 
ATAGTAATGT 
AGAGTGAGGG 
TAAAACAAAT 
TGACGCTTGT 
GTCTTTTGAG 
GCATCCTAGA 
GCAAaCCATG 
TAAGATACAm 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
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AATGAACTAC ATAACTTGTT TAAAGCAATA 
TATTTGCAAG GCTATGATGA ACCAATOTAT 
5 CTATCTCAAC AGCAATTGTT TOAATACGAA 
TTAGAAAGTG GAGAATATAC TATTTTATCA 
CAAACTTATA TTACTTATAC AAAATTGCTT 

10 

CAACAACAAG TTAAAATCAA TACTATCGAA 
TACATGTCTA ATTACGATGA TTATGTTGAA 

1$ TATCAACAOC ATCGTGGCOA ACGATTAAAA 
TATTTTCAAT TAAAAGTATT AATCGTTGOA 
TATTTTACGA AACAAATTTG GATTCGAGAG 

20 AAGTATAATG TCTCAACAAC ACACTCTAGG 
GTGTTATCAA ATACCTACGT ATTTATCAGG 
ATCTTTAATG GATGACCAAG TTATGCAGTT 

25 TATTCACTCT GGTATGGATG AAATTGAGAA 

CCGCTTCATC TTTCTAAGTC CAGAATTTCT 

TATGATAGAC TTTGGCATGA TTGTTCTAGA 

30 

TGATTTCAGA CCACATTATG CTCTAATAGG 

TGTCTTAGCA TTGACAGCAA CTGCACCACC 

AGCGATTCAA TTCAATGTTA TTAAAACTAC 

35 

TCTTAATTTT CATGATGATG AAGATAAAAT 
GGGAGCAACG ATTATTTATG TCTCATCGAA 

40 TTATGATTCA GGTTTTCTTA CAGGTATTTA 
CACAGTTCAA CAACAATTTT TAAATAATGA 
TGGTATGGGA ATTAATAAAA AAGATATTCG 

45 TCCTTCTAAC TACATTCAAG AAATTGGCCG 
AATTAGTTTA TTCCAACCGG ACGATAAATA 
GATAACAGAA GAAGATGTAC AAAATTTCGA 

50 

AGCCGTTTTG ACAACGTTGc AATCATTCTA 
GCAATCATTT AAACGAAAGC AATTAGGATT 

55 



ACTTTAAAAG GGCCATGTTA CTTACATTAT i860 

ACGAGACAGC AAGTTAGTTT AATAGAAAAG 1920 

ATGAATAATT TAGTGACAAT GATGTTTGAA 1980 

AAAATAATAA TGAAACCTAC ATTATTAAAT 204 0 

GAACAATTCA CGATGGAAGA TATAGOGGCT 2100 

GATCATGTAC TTGAAATCTT AATCAAAGGT 2160 

CTAGAAGATC AACTCCAGTT TTTGAATTTT 2220 

TTTTACAAAG AACAATTTGA CACGTTATCA 2280 

TTTGAAAGAG GTGATCTGAA TGTTGCATGA 2340 

TTTTAAACCG GGACAACAGG AAATTATAGA 2400 

TATACTTCCA ACTGGAAGTG GAAAGAGTTT 2460 

TAAGCCGACA TTAATTATCT CACCGTTAAT 2520 

GAAAATAAAT GGAGAAAAAC GTGTAACATG 2580 

AAAGCATAAT ATTAAATGTT TACGACATAG 264 0 

CCTGCAACCG TCAAATTTTA AATTAATATC 2700 

TGAAGCACAT TGCCTATCTG AATGGGGATA 2760 

AAAAGTAACA AAGCATTTTA AAGAAGCGGT 2820 

GCATTTACAA GATGATTTGA CGGAAATGTT 2880 

AATGAATCGC CCAAATATAA GCTTTAAGCA 294 0 

TGAATGGTTG CTGCCGTTTC TACAACAGTC 3000 

AAAGATGTGT CTGAATTTAG CGCAACTTAT 3060 

TGATGGTGAT ATGAATTATC AAGAGCGACA 3120 

TATTCCGATT ATAGTCGCAA CGAGTGCTTT 3180 

CACAATCATT CACTTTCATC TTTCAACAAG .3240 

TGCGGGTCGC GATGGTGAAC TAAGT CAGGC 3300 

TATTTTAGAA ACGTTATTAT TTGCAGATAT 33 60 

AATAGGAGAA TTTTTAGCTC CCGATAAACA 3420 

TAGTATOGGC GCCTTGaAAC AGATATTTAA 34 80 

CTTTCGCATG ATTGGCTATT GCAAATTGGA 3540 
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ATGTTGTGAC AATGATTCTA ATATAACTGA TATCGCAATT TTAAATAAGA AGAAGOTAAT 3660 

TAGAAOTATT GGATTTGATQ AAAAGTTGCA AAATTTATTT CTCAQATAGT ATTACTTTAC 3720 

5 

TAAAAGAAAA TTGACAAGCT ATAATTAGTG TATACACAAT TGAAAAATGA TTGAAATAAT 3780 

TTTGAAAAAT ATACATAAAC ATATGTCATG TGGGTATATT TTATGTAAAA TCATTGTAAT 3840 

w AGAATAGAAA GGAAGATGGC TATGTCTAAT AATTTTAAAG ATGACTTTQA AAAAAATCOT 3 900 

CAATCGATAG ACACAAATTC ACATCAAGAC CATACGGAAG ATGTTGAAAA AGACCAATCA 3960 

GAATTAGAAC ATCAGGATAC AATAGAGAAT ACGGAGCAAC AGTTTCCGCC AAGAAATGCC 4020 

IS CAAAGAAGAA AAAGACGCCG TGATTTAGCA ACGAATCATA ATAAACAAGT TCACAATGAA 4080 

TCACAAACAT CTGAAGACAA TGTTCAAAAT GAGGCTGGCA CAATAGATGA TCGTCAAGTC 4140 

GAATCATCAC ACAGTACTGA AaGTCAAGAA CCTAGCCATC AAGACAGTAC ACCTCAACAT 4200 

20 GAAGAGGAAT ATTATAATAA GAATGCTTTT GCAATGGATA AATCACATCC AGAACCAATC 4260 

GAAGACAATG ATAAACACGA TACTATTAAA AATGCAGAAA ATAACACTGA GCATTCAACA 4320 

GTTTCTGATA AGAGTGAAGC TGAACAATCT CAGCAACCTA AACCATATTT TACAACAGGT 4380 

25 

GCTAACCAAT CAGAAACATC AAAAAATGAA CATGATAATG ATTCTGTAAA ACAAGATCAA 4440 

GATGAACCTA AAGAACATCA TAATGGTAAA AAAGCAGCAG CTATTGGTGC TGGAACAGCA 4500 

GGTGTTGCAG GTGCAGCTGG TGCAATGGCT GCTTCTAAAG CTAAGAAACA TTCAAATGAC 4560 

30 

GCTCAAAACA AAAGTAATTC TGGCAAGGCG AATAACTCGA CTGAGGATAA AGCGTCTCAA 4620 

GATAAGTCTA AAGAT CATCA TAATGGCAAA AAAGGTGCAG CGATCGGTGC TGGAACAGCA 4680 

3S GGTTTGGCTG GAGGCGCAgC AAGTAAAAGT GCTTCTGCCG CTTCAAAACC ACATGCCTCT 4740 

AATAATGCAA GCCAAAACCA TGATGAACAT GACAATCATG ACAGAGATAA AGAACGTAAA 4 800 

AAAGGTGGCA TGGCCAAAGT ATTGTTACCA TTAATTGCAG CTGTACTAAT TATCGGTGCA 4860 

40 TTAGCGATAT TTGGAGGCAT GGCATTAAAC AATCATAATA ATGGTACAAA AGAAAATAAA 4 920 

ATCGCGAATA CAAATAAAAA TAATGCTGAT GAAAGTAAAG ACAAAGACAC ATCTAAAGAC 4 980 

GCTTCTAAAG ATAAATCAAA ATCTACAGAC AGTGATAAAT CAAAAGAGGA TCAAGACAAA 5040 

45 GCGACTAAAG ATGAATCTGA TAATGATCAA AACAACGCTA ATCAAGCGAA CAATCAAGCA 5100 

CAAAATAATC AAAATCAACA ACAAGCTAAT CAAAATCAAC AACAGCAACA ACAACGTCAA 5160 

GGTGGTGGCC AAAGACATAC AGTGAATGGT CAAGAAAACT TATACCGTAT CGCAATTCAA 5220 

SO 

TACTACGGTT CAGGTTCACC GGAAAATGTT GAAAAAATTA GACGTGCCAA TGGTTTAAGT 5280 

GGTAACAATA TTAGAAACGG TCAACAAATC GTTATTCCAT AATATAACTA TATAAATTGT 5340 
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10 



1S 



TAAATTGCGC TTATAAGTAT GTAGCGQTTT TTTCATTTTT CAAAGTTTGT TATTTAACAA 5460 

GGTCTTGTCT COAATATTQG CATATCAATT TAACTTTTTA AATAGTCATC AAAAAGATAA 5520 

AACACCACAA TCAACAAATT TAACGAGGAA GAATAAAAAA TAAATCAACA TATTAAATTG 5580 

TAGTGTTATT CAACTCCGTA GCTAACAATT CTCTATTCAC ATTAAACAAA TTGTCAAAAA 5640 

TATATCATAA ATCTTCAAGC ACAGACTTAG CGCATCAATC ACTGAACTGT TATAATAGTT 5700 

TGGGATTAAA GGAGGCCGAA ACAATGCAAA AAGTTGAAAG TATCATAATT GGTGGAGGGC 5760 

CATGCGGATT AAGTGCGGCT ATTGAACAAA AAAGAAAAGG TATTGATACC TTAATTATTG 5820 

AAAAGGGTAA TGTCGTTGAA TCAATCTACA ATTATCCTAC TCACCAAACA TTTTTCTCAT 5880 

CAAGTGATAA ATTAAGTATT GGGcGAgTAC CGTTTATCGT TGAAGAAAGT AAACCAAGAC 5940 

GTAATCAAGC GCTAGTTTAT TACCGAGAAG TTGTAAAACA TCATCAATTA AAAGTAAATG 6000 

20 CATTTGAAGA AGTATTAACT GTTAAAAAAA TGAATAATAA ATTTACTATT ACTACGACGA 6060 

AAGATGTTTA TGAATGTCGA TTTTTAACAA TCGCGACAGG CTATTATGGT CAGCATAATA 6120 

CATTAGAAGT TGAAGGTGCG GATTTACCTA AAGTGTTCCA TTATTTTAAA GAGGCACATC 6180 

25 CGT ATTTTG A TCAAGATGTT GTAATTATCG GTGGTAAGAA TTCGGCTATC GATGCTGCTT 6240 

TGGAGTTGGA AAAAGCTGGT GCTAACGTGA CGGTTCTATA TCGTGGTGGA GATTATTCGC 6300 

CTTCAATTAA ACCGTGGATA CTTCCAAATT TCACAGCATT AGTAAAT CAT GAAAAAATTG 6360 

ACATGGAATT TAATGCTAAT GTTACCCAAA TAACTGAAGA TACTGTGACT TATGAAGTAA 6420 

ATGGTGAAAG TAAAACGATA CACAATGATT ATGTATTTGC GATGATTGGT TATCATCCCG 64 80 

ATTATGAATT TTTAAAATCT GTAGGCATTC AAATTAATAC AAATGAATTT GGAACAGCGC 654 0 

CT ATGT AT AA TAAAGAAACA TACGAAACAA ATATCGAAAA TTGCTATATT GCAGGTGTAA 6600 

TTGCTGCAGG GAACGATGCG AATACCATTT TTATTGAAAA TGGTAAATTC CACGGGGGCA 6660 

TTATTGCTCA AAGCATGCTA GCTAAGAAAC AAACGCCCTT AGAATCATAA AAATAAAGGT 6720 

CTATGTACTA AATAACTTAG TTTTACAACG ACTGACATTC ATGATATGTC AAATGAGGTT 6780 

GATGACTATT GATTGTACAT AGACCTTTTT ATGTTACGTA TTCATTATAA TTCAAAATAT 6840 

45 GATTTGATTT CAGCTTTATC TAAATTGTTG CTTAACGCGA CTAATAATTT TAATCTTGCT 6900 

TTTGGACCAT TCAAGCCGTT AGAAAAAATA AAACCTTGTT GTGCGAGTTG GTAACCACCA 6 960 

CCATCGTATG CGTAAGTTGG ACTCACAATA CCATTAAAGG AACGTGAAAC TAGCACAATA 7020 

60 GGTATATTTA AAGATACTAA TTGTTGAATG CCTTCTAATG CGCTTGGAGG TATGTTGCCT 7080 

TGTCCTAACG CTTCAATAAC CATACCATCG ATACCTTCTC GACTATAAAA ACTAAAAATG 7140 
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TCCAATGCTT 


GTTGG CGATA 


TGGCATATGA TGGAATTGCA 


CACGATCCTT 


TGTCAATACA 


7260 




CCTAGCGGAC 


CATGATTTGG 


ACTTTGAAAT 


GTGTTTGTAT 


TAGACGTATG 


TGTTTTGGTA 


7320 


5 


ACATTACGCG 


CCGTATGAAT 


TTCATCATTA AaTACAACCA 


TCACGCCTTT 


ATGACGGGCC 


7380 




TTTTCATCAG 


AGGCAACGCG 


AATAGCGGAA ATATAATTAT ATAATCCGTC 


AGAACCAATT 


7440 


10 


TCATTAGACG 


AGCGCATTGG 


CCAAGAAnTA 


ACAACAGGTT 


G 




7481 


(2) INFORMATION FOR SEQ ID NO: 23 7: 








15 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: €346 base pairs 
<B) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 








20 


(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 237: 








ATGAATTATA 


CCTTCCACTA 


GAAGTGTCGG 


TATTTATGTG 


CCTGGTGGTA 


AAGCAAGTTA 


60 




TCCTTCAACG 


GTATTAATGA 


CAGCGACGTT 


AGCACAAGTA 


GCAGGTGTGG 


AAAATATTGT 


120 


25 


CGTTGTGACA 


CCACCTCAAC 


CTAATGGTGT 


GTCTCAAGAA 


GTATTAGCAG 


CATGCTATAT 


180 




TACGCAAGTT 


GATCAAGTAT 


TTCAAGTTGG 


TGGTGCTCAA 


AGTATTGCTG 


CGTTAACTTA 


240 




TGGCACAGAA 


ACGATACCTA 


AAGTTGATAA 


GATTGTAGGT 


CCAGGCAATC 


AATTTGTTGC 


300 


30 


ATATGCCAAG 


AAATATTTAT 


TTGGACAAGT 


AGGTATTGAC 


CAAATAGCTG 


GACCAACAGA 


360 




AATAGCACTT 


ATTATTGATG 


AAACAGCAGA 


TTTAGATGCC . 


ATCGTATATG 


ATGTTTTTGC 


420 


35 


ACAAGCAGAA 


CATGATGAAT 


TAGCACGTAC 


ATATGCCATT AGTGAAGATG 


CGCAAGTCCT 


460 


TAAAGATTTA 


GAATCACGTA 


TTGCTAAAGC 


ATTGCCTAAT GTGGACAGAT 


ACGACATTGT 


540 




TTCTAAAAGT 


ATCGCTAATC 


AACACTACCT 


TATCCATGCT 


AGTAATTTTG 


ATGAAGCATG 


600 


40 


CCATGTCATG 


AATACAATCG 


CGCCTGAACA 


TGCGTCGATT 


CAAACAGTAA 


ATCCTCAACC 


660 


ATATATTGAA 


AAAGTGAAAT 


ATGTGGGTGC 


ATTGTTTATT 


GGACATTATT 


CGCCAGAGGT 


720 




CATAGGAGAT 


TACGTTGCAG 


GTCCAAGTCA 


TGTATTACCT 


ACAAATAGAA 


CAGCTAOATT 


780 


45 


TACCAATGGG 


TTATCGGTCA 


ATGATTTCTT 


AACACGGAAC 


AOGGTCATCC 


ATTTATCAAA 


640 




AGATACGTTT 


GAACAAATTG 


CTGATTCAGC 


ACAACATATT 


GCTCATGTTG 


AAGCATTATA 


900 




CAATCACCAG 


CAGTCTATTT 


TAATACGTCA 


GTCTTAGGGG 


AGTGTAATTG 


AAATGATTTA 


960 


50 


TATTGATAAA 


AATGAAAGTC 


CAGTTACGCC 


GTTGGATGAA 


AAAACAATGA 


CGTCTATTAT 


1020 




TAGTGCAACg 


CnATATAATT 


TATATCCTGA 


TGCAGCATAT 


GAACAATTCA 


AGGAAGCTTA 


1080 
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GATTCAAAAG TTAATGCTGA TCATGCCAGA AGGTCCGGCA TTAACGCTAA ATCCTGATTT 


1200 




TTTTATGTAT CAAGCATATG 


CGGCACAAGT 


AAATCGTGAA 


ATTGCATTTG 


TAGATGCAGG 


1260 


£ 


ATCAGATTTA ACGTTTGATT 


TGGAAACCAT 


TTTAACGAAA 


ATCGATOAAG 


TACAACCATC 


1320 




ATfTTTTATT ATGAGTAATC 


CACATAACCC 


TTCAGGCAAG 


CAATTTGATA 


CGGCATTTTT 


1380 


10 


AACAGCTATT GCAGATAAGA 


TGAAAGCATT 


AAACGGATAC 


TTTGTCATTG 


ATGAAGCATA 


1440 


TTTAGATTAT GGTACGGCAT 


ATGACGTGGA 


ACTGGCACCA 


CACATCTTAA 


GAATG CGTAC 


1500 




ATTATCAAAG GCGTTTGGAA 


TTGCCGGCTT 


AAGATTAGGT 


GTCTTAATTA 


GTACTGCTGG 


1560 


15 


AACGATAAAG CATATTCAAA AAATAGAACA 


TCCATATCCA 


TTAAATGTAT 


TTACGCTAAA 


1620 




TATTGCGACT TATATTTTTA 


GACATAGAGA 


AGAGACAAGA 


CAATTTTTAA 


CGATGCAACG 


1680 




ACAGTTAGCT GAG CAGTT AA 


AACAAATATT 


TGATACACAT 


GTTGCAGATA 


AAATGTCAGT 


1740 


20 


GTTCCCATCA AATGCTAATT 


TTGTACTTAC 


TAAAGGCTCA 


GCAGCGCAAC 


AATTAGGACA 


1800 




ATACGTATAT GAACAAGGAT 


TTAAACCTCG 


CTTTTATGAT 


GAGCCGGTGA 


TGAAOGGCTA 


I860 




TGTAAGATAC TCAATTGCAA 


CAGCATCACA 


GTTAAAGCAA 


TTAGAAGAAA 


TTGTTAAAGA 


1920 


25 


ATGGAGTGCA AAATATGATT 


TATCAAAAAC 


AACGAAACAC 


AGCTGAAACG 


CAACTAAATA 


1980 




TTTCAATATC TGATGATCAG 


TCACCATCGC 


ATATTAATAC 


AGGTGTGGGC 


TTTTTAAATC 


2040 




ATATGTTAAC CTTGTTTACA 


TTTCATAGCG 


GTCTGTCATT 


AAACATTGAG 


GCACAAGGTG 


2100 


30 


ATATTGACGT AGATGATCAC 


CACGTAACTG 


AAGATATCGG 


CATTGTCATT 


GGCCAATTGT 


2160 




TACTTGAAAT GATTAAAGAT 


AAAAAGCATT 


TOGTTOGTTA 


TGGAACGATG 


TACATTCCAA 


2220 


35 


TGGATGAAAC ATTAGCACGT 


GTCGTTGTGG 


ATATAAGTGG 


GCGCCCATAC 


CTATCATTCA 


2280 


ATG CAT CATT AAGTAAAGAA AAAGTTGGTA 


CGTTTGATAC 


GGAGTTAGTA 


GAAGAATTTT 


2340 




TTAGAGCGGT CGTAATCAAT GCAAGATTAA CAACGCATAT TGATTTAATT CGTGGAGGTA 


2400 


40 


ATACACACCA TGAAATTGAA 


GCTATATTCA 


AAGCGTTTTC 


CCGTGCATTA 


GGCATAGCGC 


2460 




TAACTGCAAC TGATGATCAG 


CGTGTGCCGT 


CATCGAAAGG 


TGTGATTGAA 


TGATTGTCAT 


2520 




CGTTGATTAT GGATTAGGGA 


ATATTAGTAA 


TGTAAAACGC 


GCTATTGAAC 


ATTTAGGGTA 


2580 


45 


TGAGGTGGTT GTCTCAAATA 


CCTCAAAAAT 


AATCGATCAA 


GCAGAAACAA 


TCATATTGCC 


2640 




CGGTGTCGGC CATTTTAAAG 


ATGCGATGTC 


AGAGATAAAA 


CGATTAAATC 


TCAATGCAAT 


2700 




ATTGG CTAAG AATACTGATA 


AGAAGATGAT 


TGGTATTTGT 


TTAGGCATGC 


AATTAATGTA 


2760 


50 


TGAGCATAGT GATGAAGGCG 


ATGCATCTGG 


ATTAGGGTTT 


ATCCCAGGAA 


ATATTTCGCG 


2820 




TATCCAAACA GAATACCCAG 


TGCCACACTT 


AGGCTGGAAT 


AATTTAGTGA 


GTAAGCACCC 


2880 
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AATTGCATAT GCGCAGTATG GGGCTGATAT TCCGGCAATT GTTCAATTTA ACAATTATAT 3000 

TGGTATTCAA TTCCATCCTG AAAAAAGCGG TACATATGGG TTACAAATTT TGCGTCAGGC 3060 

5 

AATACAAGGG GGATTTATAA ATGATTQAAT TATGGCCAGC GATTGATTTG ATTGGGTCAA 3120 

CAAGTGTGAG GTTAACAGAG GGTAAATATG ATAGTGAAGA AAAAATGTCA OGCTCGGCTG 3180 

AAGAAAGTAT TGCTTACTAT AGTCAATTTG AATGTGTGAA TCGTATTCAT ATCGTCGACT 3240 

10 

TGATAGGTGC TAAGGCACAG CATGCCCGAG AGTTTGATTA TATTAAGTCA TTGAGGAGAT 3300 

TAAGAACCAA AGATATTGAA GTAGGTGGTG GCATTCGTAC GAAGTCACAA ATCATGGACT 3360 

r5 ACTTTGCCGC AGGGATTAAT TATTGCATAG TTGGAACGAA AGGTATTCAA GATACTGATT 3420 

GGCTTAAAGA GATGGCACAT ACATTTCCAG GTCGCATTTA TTTATCTGTT GATGCCTATG 3480 

GAGAAGATAT TAAAGTGAAC GGATGGGAAG AGGACACAGA GTTAAATTTA TTTAGTTTTG 3540 

20 TGAGACGGTT ATCGGATATA CCTCTTGGCG GCATTATATA TACTGATATT GCTAAAGATG 3600 

GCAAAATGTC CGGACCTAAC TTTGAATTAA CTGGTCAATT AGTAAAGGCA ACGACGATTC 3660 

CTGTCATTGC TTCOGGTGGT ATTAGACATC AGCAAGATAT TCAACGATTA GCGTCGCTAA 3720 

25 ATGTTCACGC TG CTATT ATA GGAAAGGCTG CACATCAAGC ATCTTTTTGG GAGGGGCTAA 3780 

AATGATTAAA AAACGTATCA TTCCATGTTT AGATGTCAAA GATGGTCGTG TCGTTAAAGG 3840 

GATTCAATTT AAAGGATTAA GGGATATTGG GAATCCTGTT GATTTAGCAA TGTATTACAA 3900 

30 

TGAAGCGGGT GCTGATGAAT TAGTATTTTT AGACATCTCT AAGACGGAAG AGGGTCATAG 3960 

CTTAATGCTA GAAGTGATTG AACAGACAGC GTCACGCTTG TTTATCCCTC TTACTGTAGG 4020 

GGGTGGGATT CAAAGTCTCG ATGATATTAC CCAATTGCTA AATCATGGTG CAGATAAAGT 4080 

35 

ATCATTAAAT TCAAGTGCTT TAAAAAATCC ACAGCTCATT AAACAAGCGA GTGATAAATT 4140 

CGGTJCGACAA TGCATCTGCA TAGCAATTGA TAGCTATTAT GATCCTGAAA GAAAAGCACA 4200 

TTATTGTTGT ACGACTGGTG GTAAAAAAAT GACAAATATT AAAGTATATG ACTGGGTACA 4260 

40 

GCAAGTAGAA CAGTTAGGTG CAGGTGAGCT CCTCGTTACA AGTATGGGAC ATGATGGTAT 4320 

GAAACAAGGC TTTGATATTG . AACACCTAGC AAATATTAAG TCTCTTGTAA ATATTCCAAT 4380 

45 CATTGCTTCT GGTGGTGGTG GCAATGCACA ACACTTTGTA GAATTATTTG ATCAGACGGA 4440 

TGTTTCTGCA GGTTTAGCTG CAAGTATATT ACATGATCGA GAAACGACGG TTCAATCTAT 4500 

TAAAGAAGTG ATACGGCAAG GGGGTATAGC AGTAAGATGA CCAAATATAA AATTGATTTT 4560 

60 AGCAAAGGTT TAGTGCCAGC AATTTTACAA GATAATCAAA CAAAACAAGT ATTGATGTTG 4620 

GGTTATATGA ACCAAGAAGC TTTTGATAAA ACGATAGAAG ATGGTGTGGT ATGTTTCTAT 4680 
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AAAOATATTC 


ATGTAGATTG 


CGACAATGAC 


ACTATTTTAA 


TTGATGTCAT 


ACCAAATGGA 


4800 




CCAACATOTC 


ATACAGGCAG 


TCAAAGTTGT 


TTCAACACAG 


AAGTTCCATT 


TTCAGTGCAA 


4860 


5 


ACATTAGCGC 


AGACAGTTCA 


AGATAGTGCC 


CAATCCAATA 


ATGAAAAGTC 


ATATACAAAA 


4920 




TATTTATTAA 


CAGAAGGTAT 


AGAAAAGATT 


ACAAAAAAAT 


ACGGTGAAGA 


AGCTTTTGAA 


4980 


10 


GTCGTAATTG 


AAGCAATTAA 


AGGTGACAAA 


AAAGCATTTG 


TAAGTGAAGT 


AGCAGATGAA 


5040 


CTTT AT CATT 


TATTTGTCTT 


GATGCATGCG 


CTTGGCGTCG 


ATTTTTCAGA 


AATTGAGGCG 


5100 




GAATTAGCGC 


GTAGACATCA 


TAAGCGCAAT 


AACTTTAAAG 


GTGAACGACA 


AAATATCGAA 


5160 


15 


CAGTGGTAAA 


GCAAGTATGG 


ACTAAGATAT 


AAGGAAAAGG 


ATCATGGCTT 


ATACACTTAC 


5220 


AAATATTGTG 


GAAAACGTGA 


CATTTTCAAG 


TTTAAAATAC 


GACACCAACA 


TATTTTAACT 


5280 




ATGAATGCTG 


TGATGGTACT 


AAAGTTGCGA ACTCGTTATA 


GATAAGTAGT 


GGATAATCAC 


5340 


20 


AATACGAAAT 


CAAAAATAAT 


TATAAAAAGT 


AAATTGAGCA 


ACTCAGGAAT 


AGATGTCACT 


5400 




GTTAAAGATG TCGAAAAGTA TATGAATCGA TATAATGAAG 


TTATGAAGGG 


AAAAAATGGC 


5460 




GAAAAAGCTA 


AAGAGTTATG 


TTTGTCGTTA 


CTACCTATTA 


ATATCATAGT 


TGTCTTTACA 


5520 


25 


TTCTTTGTAT 


TTATACTATA 


AATACAAATA 


TATCTAGCCT 


GAAATAGAAA 


TGTCATAGCC 


5580 




TATTTAAAAG 


ACAATCTCCA 


TTAGAACTAA 


GATATG CATC 


CCGAAAGTTA 


GACTAAAAAA 


5640 




CTAACTTTAT 


GGGATGTATT 


TTTATGCTAA 


TCATCATAAA 


TTCGAGATTA 


AGTTAAAGGT 


5700 


30 


AGTTCAAGAG 


TAATTAAACA 


ATAAATwAAA AATAGTAGGA 


TACTTACTTT 


GAGGGAAGAA 


5760 




AATTAACTGT 


ATATATTTAG 


TTTAGGAACA 


AGTATTACGG 


TTTATCCTGA 


TACAATTATT 


5820 




GTGGATGGGA 


TGATATTTTT 


AGGTTTAAAA 


TACGACACCA 


GCAAACATAA 


TAACTGTAAT 


5880 


35 


AG CTCATAAA 


TCTCCCCATA 


TAGCTAATCT 


AAAAAAATAA 


TACATCATTG 


GAATTAAGCC 


5940 




CCAASCATGT 


AAATATTAAA 


AATCAAAAmA 


GATATmTGTA 


AAAaAGTTAC 


AATT t GCATA 


6000 


40 


ATTAAATTGT 


GTCTAATTAT 


TGACTAATTA 


AATTTTGCCA 


AATATAATAT 


TAATTAATAA 


6060 


TTTGaAATGA 


TTAGCGTATA 


CACTTTAAAT 


TCTCTTTGGA 


GAATATATTT 


TTTAAATACA 


6120 




AATGTAAACG 


CTTTCTCGTC 


AAATTAAACA 


ATAGAAAGGA 


TGGTCATTAT 


GAGTGCTTGG 


6180 


45 


TTAAGTAAAT 


TATTTGAGTT 


TATTCCTCGA 


ATAATTATCA 


ATTTGTTTAT 


CTAAAATAAA 


6240 




AAAATAGAGG 


TGCTGACAAT 


GATGAAAAGT 


CAAAATAAGT 


ATAGTATTCG 


TAAATTTAGT 


6300 




GTAGGTGCAT 


CTTCCATTTT 


AATAGCTACA 


TTACTATTTT 


TAAGTG 




6346 


60 


(2) INFORMATION FOR SEQ ID NO: 23 8: 









(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 3775 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 238: 

TGATAATGAT TCTCATTGTC ATACATCACG AAGGAGGCTA ATTAGTCAAT GAATAAAGTA 60 

ATTAAAATGC TTGTTGTTAC GCTTGCTTTC CTACTTGTTT TAGCAGGATG TAGTGGGAAT 120 

TCAAATAAAC AATCATCTGA TAACAAAGAT AAGGAAACAA CTTCAATTAA ACATGCAATG 180 

GGtACAACTG AAATTAAAGG GAAACCAAAG CGTGTTGTTA CGCTATATCA AGGTGCCACT 240 

15 GACGTCGCTG TATCTTTAGG TGTTAAACCT GTAGGTGCTG TAGAATCATG OACACAAAAA 300 

CCGAAATTCG AATACATAAA AAATGATTTA AAAGATACTA AGATTGTAGG TCAAGAACCT 360 

GCACCTAACT TAGAGGAAAT CTCTAAATTA AAACCGGACT TAATTGTCGC GTCAAAAGTT 420 

AGAAATGAAA AAGTTTACGA TCAATTATCT AAAATCGCAC CAACAGTTTC TACTGATACA 480 

GTTTTCAAAT TCAAAGATAC AACTAAGTTA ATGGGGAAAG CTTTAGGGAA AGAAAAAGAA 540 

GCTGAAGATT TACTTAAAAA GTACGATGAT AAAGTAGCTG CATTCCAAAA AGATGCAAAA 600 

GCAAAGTATA AAGATGCATG GCCATTGAAA GCTTCAGTTG TTAACTTCCG TGCTGATCAT 660 

ACAAGAATTT ATGCTGGTGG ATATGCTGGT GAAATCTTAA ATGATTTAGG ATTCAAACGT 720 

AATAAAGACT TACAAAAACA AGTTGATAAT GGTAAAGATA TTATCCAACT TACATCTAAA 780 

GAAAGCATTC CATTAATGAA CGCTGATCAT ATTTTTGTAG TAAAATCAGA TCCAAATGCG 840 

AAAGATGCTG CATTAGTTAA AAAGACTGAA AGCGAATGGA CTTCAAGTAA AGAGTGGAAA 900 

AATTTAGACG CaGTTAAAAA CAACCAAGTA TCTGATGATT TAGATGAAAT CACTTGGAAC 960 

TTAGCTGGCG GATATAAATC TTCATTAAAA CTTATTGACG ATTTATATGA AAAGTTAAAT 1020 

ATTGAAAAAC AATCAAAATA ATTAAGGAGT TTTACGATGC TACTTAAACC AAAATACCAA 1080 

40 ATCGTTATTG CTGGTTTATG TCTTGCAATA GTAGCTATCT TAAGTTTAAT GATTGGAAAT 1140 

ACGCTTGTGT CACCAGGTAC GGTGATACAG GCGTTATTCA ACTTTGATAG TGAAAACGAT 1200 

TTACATGATG TTGTCACTGG TGCACGGGCG TCGAGAACAA TCATTGCGTT ATTGACTGGT 1260 

45 GCTGCCCTTG CTGTCTCAGG TTTGTTGATG CAAGCACTTA CACGAAACCC AATAG CCTCA 1320 

CCAGGGCTTT TCGGTGTCAA TGCAGGOGCA GTATTTTTTG TCATTTTTAG TATTACATTT 13 80 

ATCCAAATTC AATCTTTTAA AATGATTGTA GTTATTGCAT TTTTGGGGGC TATTGTTGTT 1440 

60 

ACTGTATTAG TTGTTGCACT AGGTATGTTT AGACAAACAC TATTCTCACC TCACCGTGTC 1500 

ATTTTGGCAG GTGCTGCGAT TGCGATGCTA TTTACAGCCT TTACTCAAGG CATACTTATT 1560 
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AATATTTGGG ATATCCCATO GATTATTCCG 
AGCATGQCTG CACACATCAA CATCTTOATG 
5 CAAAACATAA AATTAATCAA ATGGATGATT 

TCGGTAGCCG TAGCTGGATC AATCGTCTTT 

CGATTATTAC CACCAAACTA TAAGTATTTA 

10 

CTAATGATCA TTTCAGACAT TGTTGCTCGT 

GGTGTCGTTA CCGCTGTCAT TGGCGCTATT 

CAACGCTTAT GACCGAAAAG ATTAATAAAA 

1$ 

TCTTTTTAGC CATCGTTTCA GTGGTAAGTA 
AACGCGTACT GATGTACTTT ATAAATCCAA 
TATTACGCTT ACCTCGCATT ACACTTGCGA 

20 

GTTTAATGTT GCAAAATGTA TTAAAAAATC 
CAGGTGGTGC TAG CTTAAGT GCTGTTGTCT 

25 ATTTACTTCC ACTATTTGCA GTATTAGGTG 

TTCAAACGAA AGGACAAATA CGCCCGACAA 
CGTTGTTTAT TGCGCTTGTC CAAGGATTAC 

30 AAGCTTATAC ATGGCTAGTC GGAAGTCTTT 

TGGGTATGGT TATTTTAGCT GTTGTGCCGT 

TATCTATACT TGATGACCCT GTAGCGATTG 

^5 _ 

TAATCCAATT AATCACTTCT ACTATACTCG 

TTGGGTTTGT CGGTTTAATC GCACCACATA 

CTAAAAAGTT ACTAATGTCA GCAATGATTG 

40 

TTGGGCGTAC CTTATTCTTG CCTAAAGAAG 

GTGCCCCATT CTTCATATAC TTATTATTAA 

ACAAAATGAC CTCACAACGA AGTTAGCTAA 

45 

TTTTTATACA TATAGTTGTT GTTATTGTTA 
ATACTTTATA TACAAATAAC ACCGACTCAT 
so TTTTCAAATA TCGATAACTA TTTCTTATTT 

AAAAACACAA ATTTTAATAA AAATATCATA 



CTTGTATTGA TACTTATTTT AATTGCATTT 1680 

ACAAGTGACG ACATTGCAAC CGGCCTCGGT 1740 

ATTATGCTCA TCAGTATGTT AGCCGGTATT 1800 

GTGGGTCTTA TCGTACCGAA TATTAGCAAA 1860 

ATTCCTTTTA CTGCATTAGC TGGAGCAATC 1920 

ATAATAATTA AGCCACTAGA GTTG CCTATC 1980 

GTCTTAATCT ATATTATGAA GAAAGGACGT 2040 

AAGACAATTA CCATCTCATC TTCGCGTTAA 2100 

TGATGATTGG TTCAAGCTTT AT AC CATTAC 2160 

ATGACAGTAT GGATCAATTC ACTTTAGAAG 2220 

TTTTAGCAGG TGCCGCACTA GGAATGAGTG 2280 

CAATTGCCTC ACCTGATATT ATCGGTATCA 2340 

TTATTGCATT TTTCAGCCAT TTAACAATAC 24 00 

GCGCAGTTGC AATGATGATA CTATTAGTGT 2460 

CACTCATAAT CATCGGTATT TCGATGCAAA 2520 

TCATTACAAC GAAGCAATTA TCTGCTGCCA 2580 

ACGGTGCTAC GTTTAAAGAT ACAATCATTT 2640 

TGTTATTTCT TGTTATACCA AAAATGAAAA 2700 

GCTTAGGCTT ACATGTACAA CGTATGAAAC 2760 

TATCTATGGC AATCAGTTTA GTAGGTAACA 2820 

TCGCGAAAAC AATCGTTCGC GGAAGTTATG 2880 

GTGCCATATC AATTGTTATT GCAGACTTAA 2S4 0 

TGCCAGCAGG TGTATTTATT GCTGCTTTTG 3000 

CCGTGAAAAA GTTATAACGA TATTATTAAA 3060 

ATGATTCAGT TAACTAACCG TTGCGAGGTT 3120 

ACAAGCGTCG ACTTTCTTAA TTACATATTA 3180 

ATTCTATAAT ATCAATCAAT ATTCTTCGAT 3240 

AAATATAGTG TTTGATAATG TCATTTATTC 3300 

TTATTTTTAA TTGTAAATTA TGGATTATTT 3360 
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ATATAATAAC 


CATGACAAAA 


TTAGAGATTT 


TATAATCATT 


GAAGCATATA 


TGtnTCGTTT 


3480 




TAAGAAAAAA 


GTCAAGCCTG 


AAGTCGATAT 


GACTATAAAA 


GAATTTATAT 


TACTGACTTA 


3540 


5 


TTTATTTCAT 


CAGCAAGAAA 


ACACACTTCC 


ATTTAAGAAG 


ATTGTTTCAG 


ATTTATGTTA 


3600 




TAAACAATCG 


GATTTAGTAC 


AGCATATAAA AGTACTTGTG 


AAACATTCAT 


ATATTAGTAA 


3660 


10 


AGTTCGAAQT 


AAAATTGATG 


AGCGTAATAC 


TTACATTTCA ATATCTGAAG 


AACAACnAGA 


3720 


nAAAATTGCA 


GAACnTGTTA 


CATTGTTTGA 


TCAAATCATT 


AAACAATTTA 


ACCTT 


3775 




(2) INFORMATION FOR SEQ ID NO: 239: 








is 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1361 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
<D> TOPOLOGY: linear 








20 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 239: 








AGAAAAATTA 


GCCTACCTAT 


GCAAGTTGTT 


ATTGCATTAG 


TGTTAGGTGT 


TGTCGTAGGA 


60 


25 


CTTTTATTAT 


ATGGACAAGA 


AAACGTAGCA 


AATTACATTA 


AACCATTTGG 


TGACGTATTT 


120 




TTAAATTTAA 


TTAAAATGAT 


CGTTATACCA 


GTTGTATTTT 


GCTCACTAGC 


GCTTTCTATT 


180 




TCGAACGTTG 


GGGAATCGAA 


AACTGTAGGG 


CGTTATGGCT 


GGaAAACAAT 


TTTATACTTT 


240 


30 


GAAATTATTA 


CAACAATCGC 


AATAGGTTTA 


GGGATTATCT 


TCGGTAACCT 


ATTTAAACCA 


300 




GGTGCTGGAT 


TAGACCCAAC 


AAAATTACCT 


AAAGGTGATA 


TTTCTAAATA 


TCAATCAACT 


360 




GCACATGCAG 


CAGAACAATC 


TACATATGGa 


AATCATTTTA 


TTGATACCAT 


TGTACATATT 


420 


OS 


ATTCCGACAA 


ACTTTTTPGA 


AGCTTTAAAT 


AAGGGTGAAT TATTACCTAT 


TATCTTCTTC 


480 




GCAGTATTCT 


TTGGATTAGG 


ATTAGCTGCT 


GTAGGTAAAA 


AAGCAGAACC 


AGTTAAAGAA 


540 


40 


TTTTTAAGCG 


GATCGCTTGA 


AGCTGTGTTC 


TGGATGATTA 


ATAAAATTTT 


AAAATTAGCA 


600 


CCACTTGGAG 


TGTTTGCATT 


CATTTGTACT 


ACAATTATTA 


CATTTGGTGC 


ATCCGCATTA 


660 




TTACCACTAT 


TAAAATTAGT 


ATTAGTTGTT 


GTCTTTGCAA 


TGGTGTTCTT 


TGTATTCGCT 


720 


45 


ATACTAGGAC 


TAGTTGCATG 


GATGTGTGGT 


ATTAATATCA 


TGAATATTAT 


TAGAATCTTG 


780 




AAAAGTGAAT 


TGCTTTTAGC 


ATTTTCTACA 


TCAAGTTCGG 


AAGCTGTACT 


TCCTGTAATG 


840 




ATGAAGAAAA 


TGGAAAACTT 


CGGTTCTCCA 


AAAGAAATTA 


CTTCTTTTGT 


TATACCAATT 


900 




GGTTATACGT 


TTAACTTAGA 


TGGATCAGCA 


CTTTATCAAT 


CTATTGCAGC 


ATTATTCGTT 


960 




GCACAGATGT 


ATGGAATGCA 


CTTAACATTA 


TCAGAGCAAA 


TTGTGTTGAT 


GTTAACATTA 


1020 
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ACATTAGGTG CCATGGGCTT ACCGGCACAA GGTTTAGCAT TAATTATTGO TGTTGACCQT 1140 

ATCTTAGATA TGGTACGTAC ATGTGTAAAC GTTATTGGTA ATGCATTATC AACAATCGTT 1200 

ATAGCTAAAT GGGAAAACGT ATATGACAAA OCAAAAOOTC AAQAATATTT AAAATCAATT 1260 

TAAAAAATAC TATCTGACAT TTAArGnCCC TTACAACCTT TGGTTgTnAG GO CTnTTTTA 1320 

TGTCATGOGT CTTAAAGCCA GGCCGTATAn CGGTAAGCGT A 1361 



(2) INFORMATION FOR SEQ ID NO: 24 0: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1489 base pairs 

(B) TYPE: nucleic acid 

15 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 240: 





TCAATATGTA AATCGGCGAT 


TGTCCCTATC 


tTCATACCCT 


TACCTTCTTT 


ACTCAAATTA 


60 




AAATGTTATT 


TATTATGCCA 


TaGCTTATCT 


AA1AXA1A1A 


GTTAACTGCT 


TCATTTAGAT 


120 


25 


GATTATTTTA TATTTTTGCA TAAAAACTTA 


TATCTTTTCA 


AAAAAATCGA 


TAAGTTTTAG 


180 




TTATCATACC 


CTTACCTATC 


AAATGTTTTT 


TCTTATATTT 


AAAAAAATAA 


TTGCTTTATT 


240 




AAATGGATTT 


CTTT AG T ATT 


TATAATTAAG 


AAAACGCTTA 


CACACAACTT 


TTTTATTTGC 


300 


30 


TTTATCCTGA 


GGAGGAAAAT 


TATGGCAAGA 


AAATTGCATA 


GAGAGTTGAA 


TAACAGACAC 


360 




ATCCAATTAA 


TAGCAATTGG 


GGGCGCAATT 


GGAACTGGGT 


TATTCCTAGG 


ATCAGGTCAA 


420 




ACAATAT CTT 


TAACTGGTCC 


ATCACTGTTA 


TTCACATACA 


T<3ATTATTGG 


GGTTGTACTA 


480 


35 


TTCGCTTTTA 


TGCGCGCATT 


AGGCGAATTG 


TTGTTGAGCA 


ATACAAGATT 


TAATTCATTT 


540 




gttgaTattg 


CAAATGAATA 


TTTAGGCCCT 


TTTGGTGGCT 


TTGTCATTGG 


CTGGACTTAC 


600 


40 


TGGTTATGTT 


GGATTGTATC 


AAGTATGTCA 


G AC CTAACTG 


CGATGGGACA 


ATACTTTGCA 


660 


TTTTGGTATC 


CACAAGTCCC 


AAATTGGATT 


ACCGTGCTAT 


TTATTGTTTT 


AATCTTGATT 


720 




AGCTTCAACT 


TATTAGGTGC 


CAGATTATTT 


GGTGAACTGG 


AGTTTTGGTT 


CTCGATTATT 


780 


45 


AAAGTTGTCA 


CAATTATTGC 


GATGGTTATC 


GTTGGTCTTG 


TATTAATCTT 


TTTCTCATTT 


840 


AAAACACATT 


ATGGACATGC 


ATCATTCACA 


AACTTAATCA 


GTCACGGTGG 


CATGTTCCCT 


900 




GGTGG Aa CAT 


TTGGTTTCTT 


AATGTCATTC 


CAAATTGCTG 


TATATTCATT 


CATTGGTATT 


960 


50 


GAACTTATAG 


GTGTAaCTGC 


TGQTGAAa CG 


AAAGATCCTG 


AAAAAACCTT 


ACCGAAAGCA 


1020 




ATTAATAATG 


TACCTATCCG 


TATTTTATTA 


TTCTATATCG 


GTGGTCTATT 


AGTAATTATG 


1080 
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TTAATCGGCG TACCATTTGC AGCAGGTGTC GTTAACTTTG TCGTGCTAAC TGCCOCGGCC 1200 

TCTGCTACAA ATAGTGGTAT CTATTCGAAT AGTCGTATCT TATTCGGACT GTCACAACAA 1260 

GGGTTAGGTC CTAAAGTTTT AAATAAAACG AATAGTCATG GCGTGCCTTA TTTATCAATG 1320 

TTAGTTTCAT CAATTGCATT ACTTATAGCA GCCTTGTTAA ACTACATTTT CCCTAATGCA 1380 

ATTCAACTAT TCATATACGT TACAACGTTA tCAACTGTGT TGTTTTTAGT TGTtTGGGCA 1440 



ATGATnATTG TCGCTTATCn AATGTATTTG GAAAAAGCAT CCTGAGGCA 

(2) INFORMATION FOR SEQ ID NO: 241: 

(i) SEQUENCE CHARACTERISTICS : 
« (A) LENGTH : SOOO base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNES S : double 

(D) TOPOLOGY: linear 



20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 241: 





TTTTCCATCA 


TrATcACCAT 


TTAAGACAAT 


AGCTGTATGA 


CCATATCCTC 


CACCAAATCT 


60 


25 


TCCACTAAAA 


ACCACTAAGT 


CCCCAGGTTC 


AGCTTTGAAA 


GTTGGTGTGT 


TGTGATAAAT 


120 




TTTAGCTTCA 


CTATTAAAAT 


TATTTGCATA 


TGGTATATCT 


TTAGCTCCAT 


ATCCTTTtAA 


180 




TCCAkGACCA 


TAAAGAkGAT 


TCCAATATAC 


ATTAACTAAA 


TCGAAACATT 


GCCATCCATA 


240 


30 


ACT AC CGTCG 


AAATCCCATC 


CTCTATTCTC 


TAATGTTTTC AAATAATTTA 


ATGTACTGCT 


300 




ATTACTATTA 


CTTTTATTAT 


TTGAAGACAC 


TGTTTTTGGT 


TTTGGTTCTA 


CTAATGGTGT 


360 




CATTGGCACT 


TTTAATTTTT 


GACCAATAAA 


TATTAAATTA 


GGATTTGCTA TATTATTTGT 


420 


35 


ATTTTGAATA 


TTTGAAACTG 


TAGTTTTGTA 


TTTTAATGCT ATAGCACTAA . 


GTGTGTCTCC 


480 




i-rrrj^i'ACA 


GTATAGATTT 


GTGTTTTTGG 


AGCTTCTCTA 


AAACTGTAGT 


AACCAAAGTA 


540 


40 


ATTATTAGTA 


ACTTTATTCG 


TTTTCTTCTG 


ATTAGAATTT 


TGAGCTTCCA 


AGTTTGCAAT 


600 


TTTAATTTCT 


TTAGTAAGTT 


CATTGTTATT 


AATAACTAGA 


TTGTTACCTT 


GGCTTGAGTT 


660 




TTTCGGAGTA 
TTTGTTGTCT 


TTTGAAATCT 
AACTTTAAAC 


TTATATCTTG 


ATTAATTTCA 


TTTCCGTTTG 


AAATTGCTGA 


720 


45 


TTGTGTCCGA 


TGTTTTAACA 


GCACCTTCAT 


TTTTTATTTT 


780 




GTCTTTTGTC 


GTATTTTTAT 


TAG CATTTAA 


CTCTGATTTC 


GCGAATACAT 


TTTGCTCATA 


B40 




CCCTCTTGTA 


AAATCTTTAG 


ATTTATCAAT 


TTCATCTGCA 


TATGCTTTGT 


TCGACATACC 


900 


50 


CAATGCCAAA 


AACATACCTA 


TTGAAATTGA 


CAAAATTCCA 


ATACTAACTT 


TTCTAATTGA 


960 




ATAGCGTACT 


TTACTTTGTT 


GTTTATTCAT 


GATGAAACAC 


TCCTTACAAT 


AATATACAAA 


1020 
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GTAGfOAOOTA AAATAATTAA CTTGTCTTTC CAAAATATGA AAAGTGTACT AAAaTTCATC 114 0 

GCACGACAAA TAGCCCATTT CCGATACTTT TATAAAGTAT GGAaTGGGCT ATAGCCATTT 1200 

5 ATATCATCTT TTAACTTTAT TTATTAACAG TTAATAATGA TTCATAAATA CCTGCTTCTT 1260 

TAGCAGCTTC AATTAATGTT GAACCAATTT CTGAAGGTGT TGCOGCTGTT TTCACACCAC 1320 

AACTATTTAA TGTTTTAATT TTCTCTTCAG CAGTACCTTT ACCACCTGAA ATGATTGCAC 13 80 

10 

CAGCATGTCC CATACGTTTT CCAGGAGGTG CTGTTTGTCC ACCGATAAAG CCTACAACTG 144 0 

GTTTTGTCAT ATTCGCTTTA ATCCATTCAG CTGCTTCTTC TTCAGCCGTA CCACCGATTT 1500 

CACCAATCAT AACAACTGCT TTCGTTTCGT CATCTTCATT GAATGCTTTT AAAACATCAA 1560 

TAAAGTTTGT TCCGTTGACT GGGTCTCCAC CAATACCAAC AGCTGTAGTT TGACCAATAC 1620 

CTTCTTCAGT CAATTGGTGC ACTGCTTCAT ATGTTAATGT ACCTGAACGA GATACTACAC 1680 

2Q CAACATGACC TTTTTTGTGA ATATAGCCAG GCATAATACC AATTTTACAT TCATCTGCTG 174 0 

TAATCACACC TGGACAGTTC GGACCAACTA AACGTGTTTT TCTACCTTGT AAGTAGCGTT 1800 

TAACTTTAAC CATGTCTAAT ACAGGAATAT GTTCAGTGAT ACAAATAACC ATATCTAAGT 1860 

25 CTGCATCAGC TGCTTCTAAA ATTGAGTCTG CAGCAAATGG TGCTGGAACG TAAATGACTG 1920 

AAACCGTTGC CCCAGTTTCA TTTTTAGCTT CTTCAACAGT GTTGAAAACA GGAACGCCTT 1980 

CAACAACTTG ACCACCTTTA CCAGGCGTCA CACCTGCTAC TATTTTCGTA CCATAATCAA 2040 

30 GCATTTGTTT TGTATGGAAA AGGGCAGTAG ACCCTGTAAT ACCTTGTACC ATTACTTTAG 2100 

TATTCTTATC TATAAATACA CTCATCTTAG TGCTCCCATC CTTTCCTTAT GCTTCTTTGA 2160 

CTAGTTTAAC AATTTTTTGT GCACCTTCAG CCATTGTTGC TGCTGGTTCA ATTGCTAATC 2220 

35 

CTGAGTCTTT TAAGATTTTT TTAC CTAACT CAACATTTGT ACCTTCTAGG CGTACAACTA 2280 

GTGGTAAAGT TAAATCT AC T TCTTTTACAG CTTCAACGAT ACCTTCTGCG ATAACATCAC 2340 

ATTTCATAAT GCCACCGAAA ATGTTTACAA AAATACCTTT AACATTTTCA TCACCTAAAA 24 00 

40 

TGATTTTAAA TGCTTCAGTT ACTTTTTCTC TAGTAGCGCT TCCGCCTGCA TCTAAGAAAT 24 60 

TGGCTGGGTT TCCACCGAAA TGATTAATCG TATCCATTGT TGCCATGGCT AAACCTGCAC 2520 

CATTAACCAT ACATCCGATG TCACCATCTA ATGCAATGTA TGATAAATCA TGTTTAGACG 2580 

45 

CTTCAATCTC TTTCGGATCT TCTTCTTCTA AATCACGTAA TTCTACAACA TCTTTATGTC 2640 

TGAATAATGC ATTATCATCA AAATTAATTT TAGCATCTAA TGCCAATACA TCACCATCAG 2700 

60 CTGTTGTAAC TAATGGGTTG ATTTCTACGA TTGAACAATC TTTTTCAATG AATACATTAT 2760 

AAAGTGCTAA TAAGAATTTA GCAGCTTTGT TAACAGATTC TTTAGGAATA TTAATATTAA 2820 
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10 



15 



20 



25 



35 



40 



45 



SO 



AGATCTTTTC AGGAGTCTTC GCAGCAACTT CTTCAATCTC AGTGCCCCCT TCTTCAGACO 
CCATCAATGT TACTTGGTCA GTCGCACGAT CAATAACGAA TCCAACGTAA TATTCTTTTT 
GAATAGCACA ACCTTCTTCG ATATATAAAC GCTTAATTTC TTTACCTTCT GGACCAGTTT 
GATCTGTCAC CAAAGTTTTC CCTAATAATT CTTTTGCATA TGTTTCTACC TCAGATAAAG 
ATTTAGCAAT TTTTACTCCG CCTGCTTTAC CTCTACCTCC AQCATOAATT TGTGCTTTTA 
CAACATAAAC ATCAGAATTT AATTCTTTTG CTTTCTCCAC CGCTTCTTCA GCAGTAAATC 
CTACTCGTCC TTCTGGAACT GCAACGCCCA TTGAAOGAAA TATTTCTTTA CCTTGATACT 
OGTGGATATT CATCTTCCAT CCTCCTGTTA CTTAGGTTAA GTTCCCTTAC AATTATAAAA 
AATGTAAGCG CTATTGTAAA CTTAAATGCT ACTTTTTTAT CATTTAATTG AATTTTACGA 
TTTACAGTAA CGATTTTATA GGTTCAAAGC TTTTTCTATG CTCTTTCATA ATG CCAAT AT 
CATCGATTGC TAGTAAATGT TGTTTGGTAC CGTAACCCGC GTTTTTTTCA AAACCATATT 
CAGGATAATC TTTAGATAAC TGTGTCATAT AATCATCACG AAAAACCTTT GCCATGATAC 
TTGCAGCTGC AATGGACACA CTTCTTGCAT CACCCTTOAT TAAAGATACT TGAGGCAGTG 
CATTATCAAG CGTCATCGCG TCTATCAATA AATGCGTTGG TTGTACTGAT AATCCATCAA 
TAGCTCG CTG CATGGCGATT TGAGTAGCTT TATAAATATT AAATTCATCT ATTTCTTnCA 
GtGTCGCGAT CCCATATGCA AAAGCAGTAA CTTCATTTTT TAGTGCTTCA TTTAATTCTA 
GACGTTTCGT AACAGGTACT TTTTTCGAGT CATCAAGGCC . CAAATAATTG TGATTTGAAT 
TTAAAATTGT TGCGCATGCA ACGACTGGAC CTGCTAAAGG TCCTCTTCCA ACTTCATCAA 
TCCCACAAAT AATAGCATTA GGATGCTCTT TTAATATTTC ATTTTCAAAG TAAGTCATTT 
CAACATACTT TTCTTTTAAA GCTTGTTCTT TTTCTAACGC- TTTTCTGCGC CTAGCTATGG 
CATXTTGAAC ACCTTTTCGC TCATCTAAAA AGCATTCATG ATTTTCTAAT TCTTCTATTG 
TATTAACCGC ATTAATCAAC TGCGTAACTT CTTTAATTGT TAGCGTCATT TGCTAATTCC 
TCAGTCATAT CTTTAAAAAT ATCAAAACAA TAATTTCCTA TTTTAGCATT TCGAATATCA 
TAAATAATCA GTTCAATGAC TGCTTCGTAA TCAATTTCAT TACCACGTCG AATTAAGCCC 
ACGTTTTTTC CCTATCGCAT CAAACCACGC TATGATTTCT GCAt CTTCAG GAACTTCAAT 
ATTATAATGT GACTTTAATC GCGCTAAATC ATTTTGAATT AAAAAGTTTA ATCCATAGAT 
GGCAACTTCA TCTAAGTGCA CAATACTATC TTTTATCGCA CCAGTTAAAC TCAACTTCTT 
ACCGACTTCT TCATCTTCAA ATTTAGGCCA AAGTATCCCT GGTGTGTCTA ATAGTTGTAA 
TGCATTACCA ACTTTAATCC ATTGTTGTTG TTTGGTCACA CCTGGTTTAT TACCAGTCTG 



2940 

3000 

3060 

3120 

31B0 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3760 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 
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AACGATCATT 


GCTCTTATCG CTCTAGGTTT 


AAGTCCTTTC 


GCTTTTTCGC 


GTTCAAATTT 


4740 




TTCAGCAGTC 


GCCTTAATTG CTGCAGCTTC 


CACTTTCTTT 


AAATTTTTAC 


CGTGCTTAGC 


v 4800 


5 


ATCCACTGAT ACAOGATAgT AtCCTTTATC AATAAAAAAT 


tGTTCCCATT 


TTGACATCTC 


4860 




ATTTAAATTA 


GACATATCTT TTTTATTTAA 


TATAACAACA 


CGTGGTTTTT GGTTAATAAC 


4920 


10 


TTCATCTATC 


ATAGGGTTTC TTGAACTATA 


TGGAATTCTT 


GCATCTACTA 


GTTCAAACAC 


4980 


TACATCTACT 


TTTTTTAATT 








5000 




(2) INFORMATION FOR SEQ ID NO: 242: 








15 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1700 base pairs 

(B) TYPE: nucleic acid 
<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 
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Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 242: 








AACCCGnAGA 


CGAAACTnCA TAGTTGCCTG 


TTATGTTGAT 


TAGTGCGTTT 


GTAGCTATTT 


60 


2S 


nAAATCAAAC 


ATTATTAAAT ACAGCGTTaC 


CTAGTATAAT 


GAGAGAATTA 


AATATCAATG 


120 




AAAGTACATC 


GCAATGGCTA GTTACTGGGT 


TTATGCTTGT 


TAATGGCGTC 


ATGATACCTC 


180 




TGACGGCATA 


TCTAATGGAT AGAATTAAAA 


CTAGACCTTT 


ATACTTAGCG 


GCGATGGGGA 


240 


30 


CATTTTTATT 


AGGTTCTATT GTTGCAGCCT 


TAGCTCCGAA 


TTTTGGAGTT 


TTAATGTTAG 


300 




CTCGTGTAAT 


TCAAGCGATG GGTGCAGGCG 


TACTTATGCC 


CTTAATGCAA 


TTTACGTTAT 


360 




TTACATTGTT 


CAGTAAAGAA CATCGAGGTy 


TtGCAATGGG 


ACTAGCAGGT 


TTAGTAATTC 


420 


35 


AATTTGCACC 


AGCAATAGGA CCTACAGTTA 


CAGGATTAAT 


TATTGATCAA 


GCGAGTTGGC 


480 




GAGT^CCATT 


TATTATAATT GTAGGAATTG 


CTATACTTGC 


CTTTGTTTTC 


GGTTTGGTTT 


540 


40 


CAATCTCGAG 


TTACAATGAA GTGAAATATA 


CGAAATTAGA 


TAAGCGTTCA 


GTAATGTATT 


600 


CAACTATTGG 


GTTCGGGTTA ATGCTATACG 


CATTTAGTAG 


TGCAGGAGAT 


TTAGGATTTA 


660 




CAAGTCCAAT 


AGTAATAGGT GCGTTGATAT 


TAAGTATGGT 


TATTATCTAT 


TTATTTATAC 


720 


45 


GTAGACAATT 


TAATATTACT AATC3CACTTT 


TAAATTTAAG 


GGTTTTTAAA 


AATAGAACAT 


780 




TTGCATTATG 


TACGATTAGT TCAATGATTA 


TAATGATGTC 


AATGGTTGGA 


CCTGCGCTGC 


840 




TTATACCGCT 


ATATGTTCAA AACAGTTTAT 


CTTTATCTGC 


CTTGTTATCA 


GGACTTGTTA 


900 


60 


TCATGCCTGG 


TGCAATAATA AATGGTATTA 


TGTCAGTTTT 


TACAGGTAAA 


TTTTATGATA 


960 




AGTATGGTCC 


TAGACCATTG ATTTATACTG 


GTTTTACAAT 


TTTAACAATT 


ACTACAATTA 


1020 
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GAATGTTTTC AGTTTCTTTA CTCATGATGC CGATAAATAC TACAGGAATT AATTCTTTGA a 140 

GAAATGAAGA AATCTCACAT GGCACGGCTA TTATGAACTT TGGTCGTGTA ATGGCTGGTT 1200 

S 

CACTAGGCAC AGCTTTAATG GTTACATTAA TGAGTTTTGG TGCAAAAATA TTTTTATCTA 1260. 

CATCGCCATC GCATTTAACT GCAACTGAAA TTAAACAGCA ATCCATTGCT ATAGGGGTGG 1320 

ATATCTCATT TGCTTTTGTA GCTGTGCTTG TTATGGCAGC TTATGTGATA GCACTTTTTA 1380 

10 

TAAGAGAACC TAAAGAAATA GAAAGTAATA GAAGGAAATT TTAAAATAAT TATAGTAGTT 1440 

GGTCTATTTA AAATAATAGG CTAACTGCTT TTTTTATTTA ATAAAAAGTT TTATACTTTT 1500 

1S AGTGATAOAC TAAGCAAAAA TTGTTATTTG CTATGATGTA GATGTCTTAA AATGATTAAG 1560 

GGGGATTTGC TTTGTTAACG GTAGATCAAG TGAAAGAATT GGTAGGAGAA ATTAAAGATC 1620 

CTATTATAGA TGTGCCTTTA AAAGAAACAG AAGGTATTGT TGAnGTTTCT ATTAAGGGAG 1680 

20 AAnAAGAACA TGTGAGTGTT 1700 

(2) INFORMATION FOR SEQ ID NO: 243: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 10146 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 243: 



3S 



40 



45 



TGCATCAACT 


TTCAAACAAT 


AAATCATCAC 


AATAACCACA CCTAATTCAA CACTTTTCAA 


60 


ACATAAGTAT 


TGACACATTG 


AGCAAAATGA 


TTTTTAATTG 


TAACTAATAC 


AGTTACAATT 


120 


ATGAGGTGAG 


AAACATTGAA 


TTTAGAATTT 


AACATTGCCG ! TGCATGTATT "AGCTTTTTTA 


180 


ACT AAG CATC 


aTTCAGAAAA 


ATTCAATAGT 


AGTTCATTAG 


CAGAaTTAaC 


TTGTTTAAAT 


24 0 


CCTGTTCAAT 


TACGACGCGT 


GACGACTCAA 


CTTGTCGATT 


TAAAAATGAT 


TGACACAATA 


300 


CGAGGTAAAG 


ATGGCGGTTA 


TTTAGCAAAT 


GATCAAAGTG 


CTGATGTCTC 


TCTAGCAACA 


360 


TTATaTAAAC 


ATTTTGTCTT 


AGAGAAAGAA 


CACCACACAC 


GTCTATTTAC 


TGGCGACGAA 


420 


GGCAGTCACT 


GTCAAATTGC 


TCGTAATATT 


GCAACTACCA 


TGTCACATTA 


TCAGCAAGAC 


480 


GAACAGAATA 


TCATTATTAA 


TTTTTATAAT 


GGAAAAACAA 


TCAAAGATGT 


CATTGAAGAC 


540 


ATTCAAAAGG 


AGGATTTATG 


TCATGAAAAC 


ATATGATTTA ATTGTAATAG 


GATTTGGGAA 


600 


AGCTGGTAAA 


ACTTTAGCGA 


AATACGCTGC 


ATCAACAGGT 


CAACACGTCG 


CAGTTATCGA 


660 


ACAATCTCCG 


AAAATGTATG 


GAGGCACTTG 


TATAAACATA 


GGATGTATAC 


CTTCGAAGAC 


720 
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TQTTGTCAAT GCGCTAAACA ATAAAAATTA 
TGTACTGGAT TTTAAAGCGC AGTTTAAATC 
5 TQACGATATC GTOGATAGTA TTACTGCACC 

TGTCATTCCT AACATTAAAG GCCTTGATCA 
ATTAAACATT AGCTATCAAC CTAAGCACCT 

10 

AGAATTTGCT TCAATGTTTG CGAATTTAGG 
ATCATTTATG CCACGCGAAG ATCAAGATGT 
TAAAGGCATT GCATTGCATA CAAATGTTGA 

75 

TACAACAGTC CATACCAACG TTGGTAACTT 
GCGCAAACCG AATACGGATT TAGCTTTAGA 

20 CGAAATTAAA GTCAATGCTC ATCTTCAAAC 

TGTTAAAGGC GGACTTCAAT TTACGTATAT 
AGCGTTATAT GGfTAATCAGT CACGTACGAC 

25 ATTTATAGAT CCACCATTAT CACGTGTTGG 

TTATGATTAC ACTGAACATC AACTTTTAGT 
TGATCCAAGA GGTTTATTTA AAGTAGTCAT 

30 TACATTATAT GGTAAGCAAT CTGAAGAATT 

AAACATTCCA TATACCGTAT TACGAGATAA 
ATTTAATGAT TTATTTAATT TCTAGACAAA 

35 

ATGCTGCCAT CAGGCTTTAT TGTTGTGCTT 
TAT CFTGTTC TTCTTTACGA CGTTTACGTT 
CTTCAGGATC ACGTCGTTTC TTTAATTGTT 

40 

TAAGCGCagc CAGTCGGCGG TTATTAACAA 
AATAAGATTG ACAACCTATC ACGATTTCAG 
GTAACGTTCT TATATTGACT GCCTGACATT 

45 

TGCTACCCAC CTTTCTTTAT CATATCTATA 
CTATCTATTT TACTCTTTTT AATATTTTTT 
So AATGG AG CAT TTATCTTCTA ATTAAATTAG 
CCCATGATAA ATATTAAATT TTAATGGTTT 

55 



CCACTTATTA 


GCAGACGATA 


ACAACATTGA 


840 


TAATACTGAA 


GTGAATTTAT 


TAGATCAACA 


900 


TCATATCATT 


ATTAATACCG 


GTGCTACCTC 


960 


AGCTAAACAC 


GTCTTCGATT 


CGACAGGTTT 


1020 


CGTTATTGTA 


GGTGGCGGTT 


ATATCGCCTT 


1080 


TAGTAAGGTA 


ACAGTATTAG 


AACGTGGCGA 


1140 


CGTTGCATAT 


GGTATTACTG 


ACTTAGAAAA 


1200 


AACGACTOAA 


TTGTCATCTG 


ACAATCATCA 


1260 


TGAGGCTGAT 


GCAGTACTTT 


TGGCTATCGG 


1320 


AAATACTGAT 


ATOGAATTAG 


GCGACAGAGG 


1380 


AACTGTGCCG 


CATATTTATG 


CTGCAGGTGA 


1440 


ATCTTTAGAT 


GATTATCGAA 


TTATCAAATC 


1500 


TGACAATAGA 


GGCAGCGTGC 


CTTATACAGT 


1560 


ATTAACTAGT 


AAAGAAGCTG 


CCGCTCAACA 


1620 


AAGTGCTATA 


CCTCGTCATA 


AAATTAACAA 


1660 


TAATAATGAA 


AATAATATGA 


TTTTAGGTGC 


1740 


AATTAATATA 


ATTAAACTTG 


CGATTGATCA 


1800 


TATTTATACG 


CATCCTACGA 


TGGCCGAATC 


1860 


ACATAAAAAC 


CTGGTGGCAC 


GCATTGAATG 


1920 


TTCGCTTTTC 


TAATTTTTCT 


TTAAGCTTTC 


1980 


CTTCATGTCG 


TTTTCTTAAA 


CGCTCTTCTT 


2040 


GAGAAACTTT 


TTCGATTAAT 


TCTTCTTCAG 


2100 


AAGTGAATGT 


TTTTCGGCGT 


CCAGGTCCAC 


2160 


CATCGGGATC 


TAATTTTTCC 


AACTTCTTTT 


2220 


CATCACAAAT 


AAGGAATGTA 


TTTTTCATAT 


2280 


TCGTCGATTT 


CATTAATTTT 


TTCGTTAACT 


2340 


TCAAGATACG 


TAACACGGCT 


GaCAATAAAA 


2400 


ATGaTTGCTC 


CCCTATCAAA 


TCATTTATTG 


2460 


AATACCATGT 


TTTGTCCATT 


CATCATAAAT 


2520 
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TGATGTTTTA GATGCGCCGT GATACTTTTC 
AGTTTCTATA TCAACTGTAG CTTCTTTATC 
CACCATCTTT TGCACACCTT TAATGTTATT 
ACAAOGATGT GAATCTTCTA AGAAGTCACC 
CACTTCGCTA ACAAAGTGTG GTGATGACGC 
CATATTTTCA GGTGCTTGTA ATGGTTCGAT 
TTCTTCAACC GTAGTATCTT CAATTTGATG 
CGCTAGCCAT CCACTATATA CACTCACAGC 
CTTCATATTT GCAATCACTG CTAGTTTATA 
AAATTCATTT AATACTTTTA TAACTGACAC 
TTTATGACCA TTTGAATCAT CTAAATTACT 
TATATCGCAA CTTTTCGCGT ATTGTTCAAA 
TTOTTTTGCT GcATGTGGAT CTGAAATGAC 
TGGGTTATGA TGTAATGCTT TTGAATGAAT 
AGTAGCAGTT ACAAAACGAT CTAACGCAAT 
AGCATATTCT CCAGCAATAT AAAGTTTTCC 
TCCTTACTCA ATTATTTCAA TTCCTGTGGC 
ATCAAACTGT GTTAATAATT TATCTATAAT 
TTTCACATTA GGTCCCGCAT CCATTGTAAA 
GTGAACAAGC GCCATGACAT CATAACTTTC 
TCCTAGATTC GTGGCATGCA TACGCAAACC 
AAAATCTTTG TCTTGAATCG CTGCTTTTGC 
CCAATATTGA TAAAACCTTG ATGTGTTTCG 
CTTTTTAGAA TGTTGATTAA TCACAACAAA 
CGATTCAAGT GGAACGGCAT ATGACGTCTC 
TCCACCATAA ATACTACGCG ACGCAGAACC 
CTTATCTGAC AGCTGCATGT CTAGCGCTTG 
GCTTGCCGAT GAAGCCAACC CTGCTGCTGT 
ATAOCAATCG ATGCCAGCTC TATTTCTGAC 



AGCAATATCA CACAAATATT TTAGCTTTTC 2640 

CATACGTTGA ATAATTGTAC GATTCTGACG 2700 

TGTTTTAAAA GCATGAATAA GTTTTTCAAC 2760 

GTAAAATGAA GGATCTGATT TCAAAOGTTT 2820 

CGGTGAGCCA GTCCAACCGA TAAGTACTTC 2880 

GTGCAATCCA GGCCAGTTTT TGATTAAAAC 2940 

CTTAACCCAT TCATGATCAA AAGTACTATA 3000 

AATATCTCOG CATGAACTTA AACTTTGTAA 3060 

AATGTATAAA TTAGATAACT TCATATCATA 3120 

AAGTACTGCT GCACTTGAAC CTAATCCATA 3180 

ATCAATAGTC AGATGAAAAT GCTTCATCGC 3240 

TATTTCAATA GCTGTGa CCA CATAATTTAA 3300 

AATACTATCT TCATCTCTAC TAAATGTAAC 3360 

GGTACCTTTA TATTGGTCTG CTTCTTCAAT 3420 

AAGTACAGAT TTATATCCTG GTTCTGTTAC 3480 

GGGTGCTTTG ACCTGAATCA TTTTATCTCT 3540 

AATAATGTCA CTATCAATAA TTTGGTTATT 3600 

CTGTTGCTTG TTTTTCTTTT CTACAAGTAT 3 660 

ATAACACGGA TACCCCGCTT CTCGGCATTC 3720 

TTGCACAAGA TATGTGAACG GCGGTGTTGA 3 7 B 0 

ATTTTCTTCA ATTACTTCAC CAAGGCGTTT 3840 

TTCAGCTAAA TCTTCATCAA TATGATCTAA 3 900 

TGTCAATGAC ATACCATATC GACTAGGTAC 3960 

TATCATGGCA AGGTCATCTT CAAAATGATT 4020 

ATCACTATAC CCTTTTTCCC ATTCTGCAAA 40 SO 

CGAACCAATT CGCGCCAATC TCGATAAATC 4140 

ATTACAAGCT GCTGCTAAAG CTGCATATGC 4200 

TGGTACAAAA TTGTCGCTTT CAATTTCTGC 4260 

AATATCCATA TATTTTGAAA TTTTCTCTAA 4320 



55 



1031 



EP0 786 519 A2 



15 



20 



25 



30 



35 



40 



45 



60 



AAAAGTGACT TTCGTTTCAG TGTAAAATTT TTCTAATGTA ACAQATATGC TATTATTCAT 
TGGAATGATT AGTGCTTCAT CTTTTTTACC CCAATATTTT AT AAGTG CAA TATTCGTATG 
TGCACGTGCT TTGCCACTTT TAATCAACGC ATTAACCTCC TAAATTCTCA ATCCAAGTAT 
GTGCTGCACC AGCTTTTTCT ACAGCTTTTA CAATATTTTT CGCTGTTGGT AAATCTTTGG 
CAAGCAATAA CATACTTCCA CCACGACCAG CGCCAGTAAG TTTTCCAGCA ATCGCACCAT 
TTTCTTTACC AATTTTCATT AATTGTTCTA TTTTATCATG ACTAACTGTC AACGCCTTTA 
AATCCGCATG ACATTCATTA AAAATATCCG CTAAGGCTTC AAAGTTATGA TGTTCAATCA 
CATCACTCGC ACGTAAAACT AACTTACCGA TATGTTTTAC ATGTGACATG TACTGAGGGT 
CCTCACAAAG TTTATGAACA TCTTCTACTG CTTGTCTTGT TGAACCTTTC ACACCAGTAT 
CTATAACAAC CATATAGCCG TCTAAACTTA ACGTTTTCAA CGTTTCAGCA TGACCTTTTT 
GGAACCAAAC TGGTTTGCCT GATACAATCG TTTGCGTATC AATACCACTT GGTTTACCAT 
GTGCAATTTG CTCTGCCCAA TTAGCCTTTT CAATGAGTTC TTCTTTCGTT AATGATTTCC 
CTAAAAAATC ATAACTTGCA COAACAAAAG CAACCGCGAC AGCTGCACTC GATCCTAATC 
CACGTGATGG TGGTAAATTC GTTTGGATCG TTACTGCTAG CGGCTCTGTA ATATTATTTA 
ATTCTACAAA ACGGTTCACC AAAGACTTAA GATGGTCAGG CG CAT CAT AT AACATACCAT 
CGTAAACATC GCTTTTAATA GACGAATAGT TCCCGCTCTC TAAGGCTTCT ATTAAAACTT 
TGATTTT AC C TGCGTTAAAC GGTACTGCAA TAGCAGG CTC TCCAAATGTA ACAGCATGTT 
CTCCTATTAA AATAATCTTA CCTGTCGATT CCCCATATCC TTTTCTTGTC ATGTCAATAT 
CACCTTTTAT ATTTATCCTA T ACTTG ATT C ATTATTTTTA TTTATTAGTA AAAGACATCA 
TATTCTAAGT TGCAtngCAT TCGCGTTAAA TTTCATTGCA GTCTTTATCT CACATTATTC 
ATATTATGTA TAATCTTTAT TTTGAATTTA TATTTGACTT AACTTGATTA GTATAAAACT 
AACTTTCGTT TACTTCAAAG TTTAAATCTT ATCGAGTGAT ATTTCAGATT CTTTATCTTT 
TTATAAAATA GCCCTACAAT TTATAATTTT CCACCCTAAC TATAATACTA CAAATAATAA 
TTGGAATATA TAGATTTACT ACTAAAGTAT TAGAACATTT CAATAGAAGG TCGTTTCTTT 
CATAGTCATA CGCATTATAT ATACCCTATT CTCAATCTAT TTAATACGTA AAACATGAAA 
TTTTCTTATT AAATTTATTA TTTCCATCAT ATCATTACTT TTAATTTAAT GATGTTCAAT 
TTAAATATTA GGTCAATAAC ATATTTATGC TTTTTATGGA TACTTTCAAA AATAACAGCC 
CCAAACGATA ACTTGAAAGG GGCTGTTAAA TATTTAACTA TTGCATTTGA TCTATCATTT 
TCTTGTTTCT TTCAATCATT TTATCAAAAT ACGTATCGTA TCTTTGCCAT TCTTCTTGAG 



4440 

4500 

4560 

4620 

4680 

4740 

4800 

4860 

4920 

4980 

5040 

5100 

5160 

5220 

5280 

5340 

5400 

5460 

5520 

5580 

5640 

5700 

5760 

5820 

5680 

5940 

6000 

6060 

6120 
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TTACATCTTG AACAGTAATC GTTTTGTTAA GCAATGTCTC TAATGAGGCC ATACAAGATG 6240 
GTTCAATTTC AGGATATTTA AATTTAGTCA CTTCACCTTT TAAAGCATGT TCATAAAATG 6300 

TTTGCATCAT CAATGCACGT TCTGAACCAG AGCCTTCAAC ACAAAGATAA ATTTGTACAG 6360 

CAATACCGCC TCTAACTCTT CGTTGCGATA TGCCTGCAAA TTTCTTACCA TCGATACTTA 6420 

AGTCAAATTT TCCTGGGCAA TAAGAATGTT CAATTTCCAT CGTATCAATA TCAACATTCT 64 80 

CATTTTCGAA CATTTTGCTA ATTAAGAGGT ACATCACAGT AAACGCTTCA TCAATCGTTG 6540 

TTTCTGTTTG TCCTTTGAAC ATCAGCGATA TATTTAATAC ACCTTGATCT AGAACGACAC 6600 

CTAAGCCACC AGAATTTCTA ACAATGGCAT TATAACCAAT CTCATTCGTT AAATAATCAA 6660 

TGCCATCTTT TAAAAACGGC AATCTTGAAT CATGAATACC AAGAATAACA GTATGTTGAT 6720 

GAATCCAAGT ACGCACAACA TTATCTGATA TATCTTTGCC CACACTTTCG CAAAATGTAT 6780 

CATCGAATGC GAAAGATTGC ATAGGTTCTA ATCCAGAAGA ATGATCGATA TATCGCCAGT 6840 

TGACGCCATT AAAATATTTA CTCGCTAAAT CCATCGTTAT TGTAAGGCTT GCGCTGCTGT 6900 

AATAATTGAA AGATTGTATA CATCTTCAAT TGAGCAGCCA CGTGATAAGT CATTTACTGG 6960 

25 . AGAATTTAAA CCTTGTAATA CTGGACCAAC TG CATCAT AT CCACCTAAAC GTTGTOCAAT 7020 

TTTGTAACCA ATATT AC CAG CTTCTAAACT TGGGAATACA AAGACATTTG CATCACCTTG 7080 

TAATTTAGCA CCTGGCGCTT TTTTCTCAGC AACACCTGGT ACAATCGCAG CATCAAATTG 714 0 

30 GAATTCGCCA TCAATGATTG CTTCTAATTT TtCTTCTTCA GCTTTTtGTT GTGCTAATTT 7200 

GACAGCTTCT TGAACTTTTG TCACGTCGTC TGATTTAGCA GACCCTTTTG TTGAAAAGCT 7260 

TAACATTGCA ACTTTTGGAT CCATGCCAAA GCTTAATGCT GATTTTGCAC TTTCTACTGC 7320 

35 AATTTCTGCA AGTCCTTGTG AATCAAGTTC TGGATTGATT GCACAATCAC CAAAGATGTA 7380 

TTGTTCATCA CCTTTAATCA TAAAGAAGAT ACCTGATGTT CTTGATACAC CTGGTTTCGT 7440 

TTTGATGATT TGTAAAGCTG GACGCACAGT GTCGCCT G TT GAATGTGCTG CACCACTAAC 7500 

TAAACCATCT GCTTTACCAG CATAAACAAG CATTGTACCG AAGTAGTTCA CATTGTTTAA 7560 

TAATTCTTGT GCTTGTTCTT CAGTCGCTTT ACCTTTACGT CGTTCAACAA ATGATTGAAC 7620 

TAATTCAGCT TTCAATTCAC TTGTCGCAGG ATTAATTAAT TCAATATTAG AAATATCAAG 7680 

ATCAAGTTTT TGCGCTAAAG ATTGAACCTT AGTCTCATCA CCTAACACGA TTGGTGTAAC 7740 

ATAATCTGTT GCTTGTAATT GTGTTGCAGC TGTTAGAACA CGTTCGTCCT CTCCTTCAGG 7800 

TAATACGATT TTAACGTTTT TACCAGAAAG TTTGTCTTTT AATACATTTA ATAAATCAGC 7860 

CATAATGTCC TCCTGTAATA TAAATCTTAT TAATCATTCA CGGTATAATT ATACGCCATT 7920 
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TATGATAAAA TTTATAAAGA ACTGATGATT TTTGAAAAGG AG CGATAAAC ATGAGTCAAG 8040 
CAGCCGAAAC ATTAGATGGT TGGTATAGTC TACATTTATT TTATGCAGTT GATTGGGCAT 6100 
CATTAOGTAT AGTTCCAAAG GACGAACGCG ATGCACTTGT CACTGAATTT CAATCATTTT 8160 
TAGAAAATAC AGCAACTGTA AGATCATCAA AATCTGGTGA TCAAGCTATT TATAATATAA 8220 
CTGGTCAAAA AGCAGATTTG TTATTATGGT TCTTACGTCC TGAAATGAAG TCTTTAAATC 8280 

ATATTGAAAA TGAATTTAAC AAATTGCGCA TTGCTGACTT CCTAATCCCT ACATATTCAT 8340 

ATGTATCAGT CATTGAATTG AGCAATTATT TAGCTGGTAA ATCTGATGAA GATCCTTATG 8400 

AGAACCCTCA TATCAAAGCA AGATTATACC CAGAATTACC ACATTCTGAT TATATTTGTT 8460 

TCTATCCAAT GAACAAACGT CGTAATGAAA CTTATAACTG GTACATGTTA ACTATGGAAG 8520 

AACGCCAAAA ATTAATGTAT GACCATGGTA TGATTGGTAG AAAATATGCT GGCAAAATCA 8580 

2o AACAATTTAT TACTGGTTCT GTAGGGTTTG ATGATTTCGA ATGGGGCGTA ACATTGTTCT 8640 

CAGATGACGT ATTACAATTC AAAAAAATTG TATACGAAAT GCGCTTTGAT GAAACAACAG 8700 

CACGATACGG TGAATTCGGT AGTTTCTTTG TAGGACATAT TATTAACACA AACGAATTCG 8760 

25 ATCAATTCTT TGCGATTTCT TAATACATTG GTACGTTTAT AAATTAATAA AAAAATTCCA 882 0 

AGCTTATCGG TTTAAGCTTG GAATTTTTCG TTTATCTTCA GTATATT CCC GTATACATAA 88 8 0 

GACGTGATTT GGTAAATAGT TGAAATCTGT ATGTTTAAAC TTATATATAT GTGCTAATGT 894 0 

30 ATTATCAATA ACAAAGtACA CTTTGCTCAT AGCAAgTeaC CCGAgTAGTC TTCCTTGGGA 9000 

GAACTTTAAC TACTATCACT ACATATAAAC GTTAACCTCA ATAGAAATTA TACAGTCGCT 9060 

ACTCTATACA ATTTTTGTAA TGGTTAACTA ATATTATTTT AACCTATTTG AAATATTTGA 9120 

AACATATTTT TGTCGAATTT TTTTCAATAA TTTTTCCTTT TTATACTTCA AGAGAATTTT 9180 

AACTACTAAA AATTCCGATG ATTATTATTA CAATAGTATC AAATATTAGT TTTTTAAAAT 9240 

CAATAACAAC TTATCAAAAA GCTCATGTGG TTATTTTATA GTGTATAAAC TATAATGAGT 93 00 

ATTAAATTCT TATAAACAAT GGTGATGAAA TGGACATAAA TTCAGAAGAA TACAAACAAG 93 60 

AGGTACTTAT CAAAGACGTT GTCATGCTTG CTGCTCGCAT ACTATTAGAA TCTGGTGCAG 9420 

AAGGTACGCG TGTAGAAGAT ACCATGACAC GTATTGCAAA AAAACTTGGT TACAGTGAAA 94 80 

GTAACAGCTT TGTTACAAAC ACTGTCATCC AGTTTACGTT ACATTCGGAA TCGTTTCCTA 9540 

GAATATTTAG AATTACCTCT CGAGATACAA ACTTAATAAA AATTTCTCAA GCTAATAAAA 9600 

So TTTCGCGTCA AATTACAAAC AATGAAATTT CTTTAGCCGA AGCAAAAACG CAACTTGAAA 9660 

AAATATATGT TGCTAAGCGT GACAGCAGTC TTCCCTTTAA AGGTTTTGCT GCAGCAATGA 9720 
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TAGCAGGTAG TCTAGGATAC CTAGTCACTG AGATTTTAGA TCGTAAGTVA CACGCACAGT 
TTATCCCAGA ATTCaTTGGT TCaTTAGTTA tTGGGATTAT CGCCGTTATT GGACATACAC 
TTATTCCAAC AGGTGACTTG GCAACTATTA TCATTGCGGC AGTCATGCCT ATTGTTCCTG 
GTGTATTAAT AACAAACGCA ATACAAGATT TATTTGGTGG ACACATGTTG ATGTTCACAA 
CGAAATCATT AGAAGCATTG GTTTnGOGTT TGGCATCGGT GCTGGCGTTG GTAGCGTATT 
AATTTTAGTA TAGGAGTATC AGACTATGTT TTGGATCTTA AACTTTATCT TTAGCTTTTT 
AGCTTC 

(2) INFORMATION FOR SEQ ID NO: 244: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2022 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



9840 
9900 
9960 
10020 
10080 
10140 
10146 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 244: 
ATTTAATTGG TTGGTGGCGT ATTCTCnTTT CCAAGATTTG CCACGATTGG ATGTTCAGTC 
GACAAATATG TAACCAGTCC CGATAAATTA CGTTCCTCAA TCATTGATAG TATGTCTGGT 
GTTTGTAACG ATTTAT CGAG TAAGGCATCA AGCAATTGAT AATGTCCCAA TACAACAAAA 
TGCACGTTGT CTCTCAACTG CTGTTGAATA AACTGAATAA . AGAGCTTTAA GCTCTGTTGC 
ACATTCGCTA ATGATGGTGC ATAGTTTTCC AAACCAACTT GTACAGCCGC TTCATTATTC 
CGAATGATTA AACCTGTGTA TGCCACTTTT GTTGCTGCAG TTGGATACAT TGAGTAATAA 
CGCAATAATT GATCTGTAAA ATCATTTCGA AGTGCATAAA TTTGATGCTC ATGTTGCCAA 
AAATCrCGCT CACCCATCTG CTgCAAATCC TCATGGTTCA ATTGTTTCCA GTCCAACTTT 
TCAACCACAC TAAAATCAAC TAACTCATAA TCCGCTTTAT TAAAATATTT TAAAAATGCT 
GTTTCCGATT CTTTTAACGC AATTAATTGT TCTGnATTAT TCACTCGACC ACCCTTTACT 
TTCAATACTG TATTTAAAAT CACTTGGTAT TTTCGTTGTT TGCTTTACTT CTCTACCACG 
CTAAAGTGTA ATATGATTAA TAACTTATCA TTTTTAGCAA TACATTACAA CCTTTTTCAG 
AAAATTCGGT GTATTGATTT TAAAATTTTT TAAAATAnAA AAGGCAAGAC ATTTGTGCCT 
AT AAAAATG C TTAACCAAGA TTTTTATATT GaAGTTGTAC TTCTTGCACA TATTGTCCTT 
GCCTTATTAT GTAAAGTTAT TTTCTTTCTA TCTTTTTATT AAATTTAACT ATTCTTCATA 
ATCCCGATTC CCTTTAAAGT AACGTCTATC TTGTTTACTA TATACATTTT CAGGATTAAA 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
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TTGOTAAACG TTOGTTGCTG ATATAT CTGT AAAATTOTTT OOACCGACAC CTGCAATAAA 1060 

CTTAAACTCT GCTTCATCTA CCAAATAATC ATACGCTTOT OTATOTCTAT CCTOTGCGCC 1140 

5 

ATGTGGAAAT ACAAACATAT CTGTTTTACC TACAATTGQT TCAACTTCAT CTTTCCATCT 1200 

TTTAGTATCA CGTTTAATAC CTTCTAAAGA TGTTTTTTCA AAATTAATGT GACCATATGA 1260 

ATGACTCGCA AATGACCATC CATCCCGTTT CATTGCGCGA ACAACTTCCT CAGCTGCCTT 1320 

10 

TTTATTCTTT GTATAATCTT TACTCGTTAA TTCATTCGTG CGATAACCTA ATACGCCCTC 13 BO 

ATAACCGGTT AAAGCAACAA CACCTTTTTC ACCATTTAAA GAAAAATCTG GATGCTCTTT 1440 

15 TACAAATTTA TTTAAAATTG G CACG AT AT C ATTGTCATCA GAATAAGTAG CATGGCCTTT 1500 

TTTGTCTGTA GTTTCAGAAA CAACATGTTT ATTTTTATCG AGTACTAAAC GGTCAGCATA 1560 

ACCATGGTGT CTCATGTAAC TATAGTAATT CATATCATCA ATTGAGATGA TTAGTGGCTT 1620 

20 TTTACCTTTC GGCAATTTTA TTTTTTTGGC TTTTACATGA TGAGATGATA AGTCGTATAC 1680 

ATCATGTGGA TTAACGATGA TGTAATTATT TTTATATAAT TCGTTCAATG ATTTTTTAAA 1740 

TTCACTTACA GTAATCATCC AATCATTGTT GCCCTTAGCT TGGTGTGTAT CTCCTGTAAA 1800 

25 CGCAACTTTT GGGTCTGTAA TTAATGGGTG ATAAAACACA TGATAAACTT GGCCGTGATA 1860 

TGTTTCCCAA TGTTCATCCA TTTTcGATTT aTGCTTTGCA TACTCATTTG GATTAACAGA 1920 

TTTATTkTGA GCTTTCTCAT TTTGCTTGGA ACAGCTATAT mACAATGCAA CTGATAATAA 1980 

30 

CAGAAAAAAT AG CAATAAAT ATTTTTTATG CATTAAACAT TC 2022 

(2) INFORMATION FOR SEQ ID NO: 245: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 1340 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 245: 



45 



ATAGAGTGAT 


AAAGGATGGT 


TGTCATATGA 


TAAATGCAGT 


AGTAATAGCA 


GTAATTTTAA 


60 


TGATTGTGCT 


ATGTTTATGT 


CGATTAAACG 


TnTTATTAAG 


CTT ATTT AT C 


AGTGCGCTAG 


120 


TTGGTGGCTT 


AATTTCAGGC 


ATGAGCATTG 


AAAAAGTTAT 


AAATGTATTT 


GGGAAAAATA 


180 


TAGTCGATGG 


TGCTGAGGTA 


GCATTAAGCT 


ATGCTTTATT 


AGGTGGATTT 


GCAGCATTAA 


24 0 


TTTCATACAG 


TGGTATCACA 


GACTATTTAG 


TAGGAAAAAT 


TATAAATGCA ATTCACGCTG 


300 


AAAATAGTCG 


ATGGTCAAGA 


GTTAAAGTCA 


AAGTGACAAT 


AATCATTGCA 


TTATTAGCTA 


360 
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CACCATTGTT AAGTCTGTTT AATGACTTAA AAATAGATAG ACGTTTAATC GOTTTQATTA 4 80 

TCGGTTTTGG TTTATGTTTC CCGTATGTGT TATTACCATA TGGATTCGGT CAAATTTTCC 540 

AGCAAATTAT TCAAAGTGGC TTTGCAAAGG CAAATCACCC AATTGAGTTT AATATGATTT 600 

GGAAAGCAAT GCTTATTCCT TCAATGGGGT ATATTGTTGG CTTACTTATC GGTTTATATG 660 

TATATCGTAA ACCACGTGAA TATGAAACAC GTAAAATTTC AGATAGTGAC AATGTTACAG 720 

AGTTAAAACC ATATATCTTA ATAGTAACAA TTGTAGCAAT ACTAGCTACA TTTTTAGTAC 780 

AAACATTTAC AGATTCAATG ATTTTTGGTG CACTGGCAGG GGTACTCGTA TTCTTTATTT 840 

CAOGTGCATA TAATTGGTAT GAATTAGATG CTAAGTTTGT TGAAGGTATT AAAATTATGG 900 

CTTATATTGG TGTAGTTATT TTAACAGCAA ATGGATTTGC TGGTGTAATG AATGCTACTG 960 

GTGATATAGA TGAATTAGTT AAAACTTTAA CAAGTATTAC TGGTGATAAT AAATTATTTA 1020 

GCATTATCAT GATGTATGTG ATAGGTTTAA TTGTCACTTT AGGTATTGGA TCATCATTTG 1060 

CAACAATTCC TATTATCGCA TCATTATTCA TTCCTTTTGG AGCGTCAATT GGACTAGATA 1140 

CAATGGCATT AATCGCATTG ATTGGAACAG CGAGTGCATT AGGTGACTCA GGTTCGCCTG 1200 

CAAGTGATTC AACATTAGGA CCAACTGCGG GATTAAATGT TGATGGCCAm CATGATCATA 1260 

TACGTGATAC ATGTGTACCA AACTTCTTGT TTTATAATAT TCCTTTAAAT GATTTTCGGT 1320 

ACTATTGCTG CTATGGTACT 1340 
(2) INFORMATION FOR SEQ ID NO: 246: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 33 65 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 246: 

CAAAATCTAA GAGAATAAnA TTTGTTAATT TnAAATAGCA AGCAATTCAA AGTTATATGT 60 

GTAATAGATA AAATAGATAT CCCTATAGTG ATGCGTTACT AGCTAAACAT AATAACACAT 120 

TAGAAGATAA TGAAGTTAAG GAGTTACTGG ATTGTTTCGA CTATGTAATT AAGTATAAAA 180 

ATATCCAACG ACAAAACGTA ATTATAAAAT GGTAAAAGCT ATGGTACAGT TTCAAATTGC 240 

TAATGACATG CGTATCGGTG AGCTACTTGC AATAAAGAGA GTAAATATAA ACTATGAAGA 3 00 

so TAAAACGCTA GATATCGACG GTAAAGTTAA TTGGATAACT GAAAAAAGAC GGGAGCATTC 3 60 

GGAGTAAAGG AGACAACTGA AAGAAGTAAT AGCTATAAGG CCACAGGGCT CACTACCCAA 420 
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TATTCACAAA TACGTCTGOT AGCCCTATCG ACTCQAACAA AATTAGCCAC ATTATTAAAG 54 0 

GGGGGCGCTG ATATTAGTTC TATTAAGAAA CCTATAACGA CGCATACATT ACATCATTCG 600 

CATATATCTA CACTTGCTCA ATTAGGAATT AACTTAAAAG CAATGCAAGA GCATGTAGGT €60 

CATTCAGATT ATAAAArAAA TCTAGAOATA TACACACATG TTACTAATCA GATGGCGAAA 720 

GATATGATGA ATAAATTTGA ACGATTGGGG AGTTAAAATT GGAAAAAGAT GaTACACTAG 780 

CAGAAATTAA GCCTATGCTC AATTTTGATG AGCAAATAGC AAAATTAAAA CAGATGAATA 84 0 

TATTTTTTAA TATTATTGAC ACCGAAAAAG CAAATGAAAT TCTTAGAAAA AATAATTACT 900 

TCTTCAAACT wG C TTATTTC CGaAAAAATT TCGrAAAAAA GaATGGCGGC TATTTCATAG 960 

AATTTGCTTA TTTATCAGAT TT AG CAACT A TAGATATGaA ATTAAOATAC ACAATGTTGC 1020 

ATTTAACTTT AGATATTGAA CATAGTTTAA AGTATCTAGT CTTAAAACTA ATAACAGAAA 108 0 

2o ATAACCAAGA AGATGGTTAT AAAATAATAG ATGAGTTCTT ATGTATTGaT AAAT CAT AT A 114 0 

GCAATTCAAA TTTTGACACA AATTCAAGAA CACCAGAAGA AGTTATGGAA ACCAAAATCA 1200 

AAAATAAAAA CGAAATATTC AAGCATATGA ATAAACGAGG ACAACTACCC GAGAAGTTGa 1260 

25 ATAAATACTA TCmAAATCCA CCCGCnnGGk TTTGCaTTGr ATTCATGCAA CTAGGTCAAT 1320 

TCGTTTCGTT TCTCAACTTC TATTACAAGA AGTACAATGA CGAAGAATTG AGAGTTG CTA 138 0 

ATATTTTAAT GCCTTTAGTT AAAAATATAA GAAaCAAATC AGCTCATAAC CAACCCATCA 144 0 

30 TAGCAAATCT AAATTATGAC AGTAGATTAC CTCAATATTT ATTTGAAAAA GGGAATAATA 1500 

TAGGCATATC TAGAAACATG TTCGGAATAA AAAATTTCAT AGATACTkTC ksTACGCTAG 1560 

AATTACATAA TCAAGTTTGT AGTAATG CAA TTATCCAAGC AAGATATCAC GATTTGGACC 162 0 

AACTTCAAAA GCGATATAAA AGrAACGrAA G CT ATT AT AA TAATGCATTA GCTATCAAAA 1680 

GATTTTTTAT AGCTTTAGAT AAAATTATTG ACTTCAACAG ACCAAAAGTA TAAACTATCT 174 0 

AGTGAGGAAA GAGACTTATA GGTCTCGCGA GTTATTTTAA TTCGTATGCA AGAAAAAGAA 1800 

GAGCTATGCA TTTTATTTAA AATGCGTAGT TCTTtTTTTA TGCATCTAAA TTCATATTAT 1860 

TTTTGCAATA TAAACATATC TTTGTGCAAA TTCCGAACAC AAAACATTCA CAT CATC C TT 1920 

TTTtGCCCTT TTTCTATACC CCAAAACACA AAAAGCCCCG TAAGCCTATG CcTACGGGgT 1980 

TTGACAATAA ATTATATATT ATTGTTCTTC TTTAACATAT GGTAATAATG CCATATGACG 2040 

AGAACGTTTG ATAGCTGTAG TCAaCATACG TTGATATTTA GCTGAAGTAC CAGTTACACG 2100 

SO ACGTGGTAAA ATTTTACCGC GTTCTGAGAT AAAACGTTTT AATAATTCAG TGTCTTTGTA 2160 

GTCGATATGT GTAATACCAT TTGCTGTGAA ATAGCATACT TTTTTACGAC GACGTCCGCC 2220 
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CGTTAATTTT TATTAGAATG GTAAGTCATC ATCACTTATA TCAATCGGTC CGTTTGCATT 2340 

TGCAAATGGA TTATCAGATT GTTTCGTOTT TGATGAATTA TTGTACGAAT TGTTTTGTCC 2400 

TGATTGTTGA CCACCGAATC CTTGACCGTA ATCTTGGAAT TCATTTTGTT GACGTTGGCC 2460 

ACCATTTTGT TGCGCATTTT TAGGTTCAAG GAATTGAACG CTATCACACA CAACTTCAGT 2520 

AACAAACACA CGACGACCTT CTTGATTTTC ATAATTACGG GATTGTAAGC GACCATCTAC 2580 

ACCAGCTAAA CTACCTTTAG ATAAATAGTT ATTTACATTA TCTGCTTGTC TTCTAAAAAC 2640 

AACACAGTTA ATAAAATc t G CtTCGCGCTC CCCTTGAGCA TTCGTGAACG TACGATTTAC 2700 

TGCAAGAGTG AATGtCGCTA CACTCACACC TGAGGGAGTG GTTCTGTATT CCGGATCTTT 2760 

CGTTAAACGA CCTACTAATA CAACTCTATT TAGCATTTAA ACGCCCCCTC TAATTATTAC 2820 

TTGTCTTCGT CTTCACGAAT AACCATGTAA CGAATGATAT CGTCACTGAT TTTAGCTAGA 2880 

20 CGTTGGAATT CGTCAGTAGC TTTGTTGTTA TCAGATTTAA CACGTACGAT GTTGTAGAAG 2940 

' CCATCTTTGA AATCATTGAT TTCATAAGCT AGGCGACGTT TACCCCAGTC TTTTGCTTCT 3000 

AAAACTTCTG CACCTTCAGT AGCTAAGATA CCGTTGAAAC GTTCAACTAA CGCTTTTTTA 3060 

25 GCATCTTCCT CAATGTTTGG GCGTACGATG TACATAACTT CATATGTTCT CATTTTATAT 3120 

TTGCACCTCC TTGTGGTCTA TACGGCTTAT CAATCTTAAA ACAGATAAGC AAGGaATAAT 3180 

TTTCATTACT CACAATAAAG AATTa TATCA TGCGCCATTA CTTTTTACAA TaATAATTcA 324 0 

30 AACTACTCTT CATATCATTT TTGATATtAA TTCATTTGaA ACTTTCnATG ATATTTTnAA 3300 

AAATACACTT CACAAAAGCG AACATATGTn CTATAAnAGT TGTGAGGTGG TAAGGAATGA 3 360 

ATTTA 3365 
<2) INFORMATION FOR SEQ ID NO: 247: 



35 



4i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1032 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



45 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 247: 

GTTAAAAGTA ATTGGTGGTA TTGATGATGA TTTTACAGCC AATGTTATGC ATCCAAATCA 60 

ATATCGAATT CGATATTCGT CTCAGAAACA GGACCTTAAT GAAGATATGA CAGTTTTTGA 120 

so TGCAGTATTA AGTTCTGATA CAACAACTTT ACGCATCATC AAGCAATATG AGCAGGCAGT 180 

ACAAGCTTAT GCGGATGACC AAAGTGATAA ATTGTTCAAG CGAATGATGG ATGCGCAAGA 240 
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ACTAGGTATA 


CATGATACTA 


CTAAATACAT 


TAAAGAATTA 


TCCGGCGGAC 


AACAAAAACG 


360 


TGTTGTACTT 


GCTAAAACAT 


TAATAGAACA 


ACCAGATTTA 


TTGTTATTAG 


ATGAACCTAC 


420 


GAACCATTTA 


GACTTCGAAT 


CAATCAGCTG 


GTTGATCAAT 


TATGTGAAGC 


AATATCCTCA 


480 


TACTGTTTTA 


TTCGTAACCC 


ATGATCGATA 


TTTTTTAAAT 


GAAGTTTCCA 


CTAGAATTAT 


54 0 


TGAACTAAAC 


AGAGGTAAGT 


TAGCGTCATA 


TCCTGGTAAC 


TATGAATCTT 


ATATTGAAAT 


600 


GCGCGCTGAA 


AGAGAAGTAA 


CACTTCAAAA 


GCAACAACAA 


AAGCAACGAG 


CTTTATATAA 


660 


GGAAGAACTT 


GCTTGGATGA 


GGGCTGGgAG 


CTAaGGCTCG 


TACTACAAAG 


CAACAAGCTA 


720 


GAATTAATCG 


ATTTAATGAC 


CTAGAtnAATG 


AAGTTaACCA 


G CAAT AT AAA 


GACGATAAAG 


780 


GTGAATTGAA 


TCTTGCTTAT 


TCaAGATTAG 


GTAAGCAAGT 


GTTCGAATTA 


GAAGACTTAT 


840 


CAAAGGCTAT 


TAATGATAAA 


GTATTATTTG 


AACATCTGAC 


GGAAATTATT 


CAAAAmGGTG 


900 


AGCGTATTGG 


TGTTGTTGGG 


CCAAATGGAG 


CTGGTAAAAC 


AACACTCTTA 


AATATTTTGA 


960 


GTGGAGAAGA 


CCAACAATTC 


GAAGGTAAAT 


TGAAGACTGG 


GCAGACGGTT 


AAAGTAGCTT 


1020 


ATTTTAAGCA 


AA 










1032 



25 (2) INFORMATION FOR SEQ ID NO: 24 8: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 852 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS i double 

30 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 248: 
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TGTGATTAAC 


GAAGCTTATT 


TTCGTACACC 


TTCAACAACT 


GATTACAACG 


GCGTTTATCA 


60 


AGGTTATTAT 


ATTGATTTTG 


AAGCAAAGGA 


AACTAAAAAC 


AAGACGTCCT 


TTCCTTTAAA 


120 


TAATATTCAT 


GACCATCAAG 


TCGAACATAT 


GAAAAATGCA 


TATCAACAAA 


AAGGTATTGT 


180 


GTTTTTAATG 


ATTCGTTTTA AAACGCTAGA 


TGAAGTTTAT 


CTTTTACCCT 


ATTCAAAATT 


240 


CGAAGTATTT 


TGGAAGAGAT ATAAAGATAA 


TATTAAAAAG 


TCTATAACAG 


TTGATGAAAT 


300 


ACGAAAAAAT 


GGTTACCATA 


TTCCTTATCA 


GTATCAACCA 


AGATTAGACT 


ATCTAAAAGC 


360 


AGTTGATAAG 


TTGATATTAG 


ATGAAAGTGA 


GGACCGCGTA 


TGACGGAAAA 


CAAAGGATCT 


420 


TCTCAGCCTA 


AGAAAAACGG 


TAATAATGGT 


GGGAAATCCA 


ACTCAAAAAA 


GAATAGAAAT 


460 


GTGAAGAGAA 


CGATTATTAA 


GATTATTGGC 


TTCATGATTA 


TTGCATTTTT 


CGTTGTTCTT 


540 


TTACTAGGTA 


TCTTATTGTT 


TGCTTATTAT 


GCTTGGAAAG 


CACCTGCTTT 


TACCGAAGCT 


600 
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TTAGATAATG GCCAAAGACA TGAGCATGTA AATTTAAAAG ACGTGCCGAA ATCAATGAAA 720 

GACGCAGTAC TTGCAACTGA AGACAATCGT TTCTACGAAC ATGGCGCACT TGATTATAAA 780 

5 

CGTTTATTCG GTGCAATTGG TAAOAACTTG ACTGGTGGAT TTGGkTCtGA AGGtGCCTCA 640 
ACATTAACAC AA 852 
(2) INFORMATION FOR SEQ ID NO: 249: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: SB 04 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOU3GY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 249: 



20 


CACTTTTTTC 


ATTAAAAATC 


TCATATTTAT 


ACACTGAACG 


TAATCTCGAA 


TATTTTTCAA 


60 




CCCAAGTTTT 


AACTTTAACT 


TTTTCTGGAT 


AAAAAATAGA 


CTTTTTATAA 


TTGACATTGA 


120 




GGTCAGTCAC 


AGGTGAAATG ATTCCTTGTT TTTCCATATC AGCATAACTA AAACCTAACT 


180 


25 


TCGATATATA 


ATCCAACCGC 


GCAACTTCAA 


ACCAAGTTGC 


ATAATTCCCG 


TGATAAATTA 


240 




CACCCATCTT 


ATCAGTTTCA 


GCATAACGCG 


CTTCTATTTC 


TGTAATACTA 


TATATCATTT 


300 




TAAGCCTTCT 


TTCAGTTTAA 


CTTTATATCT 


CATTCTAACA 


TAAAATACAA 


GAAGAGGCCG 


360 


30 


GCCAAGAACA 


CAAAGGkTTT 


GAACCGACCT 


ATTATATCAT 


AAa GTTT AT A 


GAAGTATTTT 


420 




TGAGCACTAT 


CAAAGTGCCT 


CAAATACCGA 


TTAAAATTTT 


ACTGTGATAT 


CTATTTTTTA 


480 


35 


TTGCGCTAAT 


TTATTTCTTA 


AAACCATTTG 


TAAAATTCCA 


CCGTGACGAT AGTAATCCAT 


540 


TTCAACAAGT 


GAGTCAAAAC 


GAACCATAGC 


GTCAAATTCT. 


ACCAAATCAC 


CATCTTGCTT 


600 




CTTAjSCAGTA 


ACTTTGACGT 


AG t CATGTGG 


TTGAACATTT 


TCATCAATAT 


TAACAGrAAT 


660 


40 


TTCTTCTGTA 


CCATCTAGAC 


CAAGAGAATC 


AGCTGATTCA 


CCTTTTTTAA 


ACTCTAATGG 


720 




TAATACACCC 


ATCATAACTA 


AATTTGAACG 


ATGGATACGT 


TCATAACTTT 


GTGCAATAAC 


780 




TGTTTTAACA 


CCTAATAAGT 


TTGTACCTTT 


TGCTGCCCAG 


TCACGAGATG 


AACCCATACC 


840 


45 


ATAATCGTTA 


CCAGCTAATA 


CAACTAAACC 


TGTACCATCT 


TCTTTATATT 


TCATTGCAGC 


900 




ATCAAAGATA 


GGCATTACTT 


CATTTGTTGG 


CCAATAAGTT 


GTAAAACCAC 


CTTCAGTACC 


960 




TGGCGCTAAT 


TGGTTTTTAA 


TACGTATATT 


AGCAAACGTA 


CCTCGAACCA 


TTACTTCGTG 


1020 


SO 


ATTACCACGT 


CTTGAACCAT 


ATGAATTAAA 


TTCACGAATA 


GGCACTTGAT 


GATCTTGTAA 


1080 




ATATTTACCA 


GCTGGCGTAT 


CTTTACCAAT 


TGCACCTGCT 


GGAGAGATGT 


GGTCAGTTGT 


1140 
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TTCTTTAGAT AATCCTTGGA AGAATGATGG ATTTTOAATG TATGTTGAAT TAGGATCAAA 1260 

GTCATATAGA GGTTGATCAG TTACATCAAT CTCATTCCAT AATTCGTTGT TATTGTATAC 1320 

5 GTTATTATAT TCTTCAATAA ATAATTCAGG TGTTACAACA CTATCAACGG TATCTGAAAC 1380 

TTCTTTAATT GATGGCCAAA TATCTTTCAA ATATACATCT TCACCGTCAT TACCTTTACC 1440 

AATAGGTTCA TTTTGTAAAT CAATATCAAC CGTTCCAGCT AATGCATAAG CAACAACTAA 1500 

10 

CTGTGGTGAA GCTAGGTAAT TGGCTTTAAC AAGAGGATGG ATACGACCTT CAAAGTTACG 156 0 

GTTACCAGAT AATACAGATG TCACTAATAG GTCCTCATCA GCAATCGCTT TTTCAATTTC 1620 

1S TGGTAATAAA GGACCTGAAT TACCGATACA AGTTGTACAT CCATAACCAA CCAAGTTGAA 1680 

GCCTAAATCA TCTAAATAAG GTTGTAAGCC AGCATCTCTT AAATATCCGG TAACAACTTT 1740 

TGATCCTGGT GCTAGAGAAG TTTTAACGTA TTCAGGAACT TTCAAGCCTT TTTCAACTGC 1800 

20 TTTTTTAGCA ACTAAACCTG cACCTAACAT TACATAAGGG TTAGATGTAT TTGTACATGA 1860 

TGTAATTGCT GCTATTGCAA TATCACCTGT TTTCATTGTA GCTTTTGATC CATCTTTAAA 1920 

GTTAATTTCA GCTTTCTTAT CAAATTCACT TTTATCTAAA CCGTGTCCTT GGTTGCCTGC 1980 

25 TGGAGCTGTT ACAGAATTTT CAAATGATGA TTTCATATCA CTTAAGAAAA TTAAATCTTG 204 0 

AGGACGTTTT GGTCCTGAAA GCGATGCTTC AACTGTTGAT AAATCCAATT CGATAACATC 210 0 

TGTATAATTA GGATCTTCTT TCTCAACATC AAAGAACATA TGGTTTTGTT TCAAATATTC 2160 

30 TTTTACTAGC GOGATATGTT CGTCTGATCT ACCAGTTAAC TT CAT AT ATT TAAGAGATTC 2220 

ATCATCAACT GGGAAGAATC CGCAAGTTGC TCCATACTCT GGTGC CATGT TTGCAATTGT 228 0 

AGCACGGTCT GCTAGTGGTA AATG TTGTAC ACCTGGACCA AAGAACTCCA CAAATTTACC 234 0 

35 

AACAACACCT TTTTTACGTA GCTCTTGAGT TACTCTTAAC GCTAAATCAG TTGCTGTTGC 24 00 

GCCTTGTGGT AATGAATTTA CTAGTCGTAC ACCAATAACC TCTGGAATTG GGAAATAAGA 24 60 

AGGTTGTCCA AGCATTCCAG CTTCAGCTTC AATACCACCA ACACCCCATC CTAGTACGCC 2520 

40 

AATACCATTT ATCATTGTTG TATGTGAATC AGTACCAACT AATGTATCTG GAAATGCAGT 2580 

TTTTTCACCA TCTACATCAC GAACATGTAC AACACTTGCT AAATATTCTA AGTTAACTTG 2640 

GTGAACTATT CCAGTTGCAG GAGGAACTGC ATTGTAATTA TCAAATGCTT TCGTTGCCCA 2700 

45 

ATTTAAAAAC TGATAACGTT CATAGTTACG TTCAAATTCT AATTTCATAT TACGTTCAAG 2760 

AGCTTCTGGA TTTGCATAGC TATCCACTTG AACTGAGTGG TCAATAACTA AATCCACCGG 2820 

50 TACTTCTGGA TTAATTTTAG TAATATCTCC CCCAACGTCA TCCATTGCTT TACGTAAAGA 2880 

AGCTAAATCA ACTACGGCTG GTACACCTGT GAAATCTTGT AAAATAACAC GAGAAGGTTT 294 0 

55 



1042 



EP0 786 519 A2 



GTCTGTAATT ACAAAATCAT CTTCTTGACG 
ATAAGGTAAA TTGGAAACTT TAGTAATACC 
5 AGTATAACTT TGGCCATTCA AGTCAAAATG 

CATTTAATGA TCCCCCTTGA TACATTTTTA 
TATATTTATT GATAAACAAC TCATCATGCT 

10 

TTAATCAOAG TATATAAGCA AAACTTATCA 
TAATTGAGAA TAATTATCAA TTTCGCGAAT 
CATTGAGCAG AAAGAAAATT ATGGCACCAA 

IS 

TGATGGGAGT GGGACAGAAA TGATATTTTC 
TTGCA3TGTC TGTAGAAATT GGGAATCCAA 

2Q GCACATTATT GTAAGCTGAC TTTTCGTCAG 

CATTGCCTGT AGAATTTCTT TTCGAAATTC 
AAAAGCTTGT TACAAGCGCA TTTTCGTTCA 

25 CATAGAATAT TGATTTATGT CCCAGCCTGA 

GCGTTTATAC CGTCAAACTT CACTTTAGCT 
AAATAAACCT ATCTTAAAAT ATAAAAAAAT 

30 CGTTCTTATC CTTTTGAATA TACTCAATTT 

TCTAGCTACT AGAATGACAT ACTACTTGTT 

ATCTTTTTTC TCTATATTTC TACGTGACTG 

35 

TTCTTGTTGA CTCTTGATAT ATTCTTGTAA 

TAGGAATTTA CGTTCCTGGT TCGCATCCTT 

AAAGGAGAAT GGGAATGCAC TTATAATTGC 

40 

GCCGTTACCG CCACCAGCTA ATAAAAGTAC 
AACAACTTTT ACCATACTAG ATGGATTTAA 
AAATGTTGCT GAGTCAGCAG ATGTAATAAA 

45 

CGATAAAACA ATGCCAAATG GCACATGATT 
CATATCAAAA ATTTCTTTGT GTTTCTTACC 
SO AAACCAAACA AAACTAACAA TTGCTGGAAC 

TGAACGTCCT TTTGAAACTC GTGCAATAAA 

55 



AAGTAAAGAT 


TCTAACAAAA 


CACGAATTGA 


3060 


TTGCTCTTCT 


ACAGCTTTTA 


AATCATAGTA 


3120 


TTTTTTTGAT 


TGCTCTTTAA 


AATTTGCAGC 


3180 


TATTTATATG 


CCTTGATTAA ATTGTATTAT 


3240 


TAGAAAACGC 


TTAATTTAGG 


TTTTGACTTT 


3300 


TACAGGTAAG 


GTGTAATAAG 


TAliVii-i AT 


3360 


GATTCAATTC 


AATTTTTAAA 


CGTATTATTT 


3420 


ACTTTAATAT 


rrrrrrcAAT 


GTCATTCTTT 


3480 


GCAAAATTTA 


TTTCGTCGTC 


CCACCCCAAC 


3540 


TTTCTCTTTG 


TTGGGGCCCA 


TCCCCAACTT 


3600 


CTTCTGTGTT 


GGGGCCCTCA 


CCCCAACTCG 


3660 


TCTGTGTTGG 


GGCCCCTQAC 


TAGAATTGAA 


3720 


GTCAACTACT 


GCCAATATAA 


CTTCGTAGAG 


3780 


GTTAATTTTC 


TATAAAAGTA 


TATTTAATTT 


3840 


TTGTCAAACC 


CCTTTCTATT 


AAGTTTTCAG 


3900 


CGAGAATTCG 


TAGTTTAATA 


ACGAAATTCT 


3960 


TCCACAAAAA 


CAAACAAGTA 


GTATATCTGT 


4020 


ATTAAAATAC 


TTAACTAAAC 


TTTATTAGTT 


4080 


ACGCTTTTCA 


AGAATGTCAG 


ATTCATAATC 


4140 


GCGATGTTTA 


TTCGGAGTCA ATOTTAAACC 


4200 


GTAGAAACTT 


ACCATCATGA 


GTATGACGAC 


4260 


AGCACTTTGA 


ATCGCATTTA 


AAGCTTCAGC 


4320 


AAATGCTATT 


AAGGCCTGTG 


AAATTCCCCA 


4380 


TGAACCAAAT GTTGTTTGCA TTCCTAATAC 


4440 


GAATGATGCA 


ATTAATAATA 


ATGCAATCAA 


4500 


AAACACTCCA 


AATAGCTGTG 


TTTCAGGAGT 


4560 


TGTCTCGATG 


CCTAATACAC 


CAAAGACACT 


4620 


TAGCAAGAGA 


CCAGAAATGA ACTCTCTAAT 


4680 


CACTCCAACG 


AATGGACTCC 


AACTTAACCA 


4740 
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TGCTGTATCA AAACTATTAA ACAAGAATGT GTTTAGTAAA CTACCOOTAG AGCTAOTTAA 4860 

CATATTTAAA ATAAGAACAG TTGGTCCAAC AATTAAAGCA GCTACCATTA AAATAQTACC 4920 

5 TAAACCAATG TTCAAGTTAC TTAAGTATTG AATACCTTTA CTTAATCCAG ACCATGCACT 49B0 

TGCTATAAAT AAGATAGTAA CAACAATGAT GATAATCGCT TGTACAAACG TATTGTTTGG 5040 

AACATTGAAC AAGTAATGTA AACCACCATT AATTTGTAGA GCACCCATAC CTAACGAAAC 5100 

10 

GGCTACCCCA ACGATTGTCG CAAATACAGA TAAAACGTCA ATAAAAATCC CAATAGGACC 5160 

TTCTACTTTA TCACCTAAAA GAGGACGTAA AGTTCTAGAT AATAAACCTG GTTCACCTTT 5220 

ACGGAATTGC GAATATGCCA ACGTAACGCA ACAACACCAT AAACAGCCCA AGCATGOAAT 5280 

1$ 

CCCCAATGGA AAAATGTTGA ACGTAGAGCT TCAGTATAAG CTTCAGTAGT TTTGGGATCT 5340 

GCTGTAGGTG GCGTAGCAAA GTGCGCCATC GGTTCAGCTG CACCATAAAA CACCAAACCT 5400 

20 ATCCCCATAC CAGCACTAAA CAACATAGCA AACCATGAAA TTGTATTAAA CTCAGGTTTG 5460 

TCATTTGGTT TACCTAGTTT AAGTTTTCCA ATAGGACTAA AAATAAGGAA TATACAGAAG 5520 

AACACGATAA TCGTAGTAAG AATAAGATAA TACCAACCTA ACTTTTCTGT AATCCACATT 5580 

25 TTAATATTAT TGGTAACATA GTTGAATTGT TCAGGTAAAA ATGCACCAAG TAATACGACT 5640 

ATAGCAACAA CAATTGCACT ATAGATGAAG ACTGGTGAAT ACTTCTTTCC ATTTGGATTC 5700 

TCTGGTGAAG AAGAATTCAT AATTAATTAC TCCCTTCAAT T CT AT ATTTA ATTTTATGTA 5760 

30 GTAGAATAAA AATATTATCT AAACATTTTA TTCAATAACT CACG 5804 
(2) INFORMATION FOR SEQ ID NO: 250: 

U) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 00 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
r (D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 250: 



45 



60 



ACCCGCGAAT 


ATGGTCCATC 


CTATCGATTT 


ATTTTTAACT 


GGTTTGACAA 


TATTTAATTT 


60 


TTCATAATCA 


TTCTTAGTGA 


TTTTGACATA 


TGTTTTCGGT 


ATGAGCCAGT 


TAATAAATGG 


120 


AAAGAAGAAG 


ACAATCCAAT 


TACTTGCCAA 


ATCaATCATT 


AAATATTCAC 


TATCGTATTT 


180 


GATTATTCGA 


TATTTAGGGT 


TTTTATTAAT 


AACTTTAGAT 


TCGCAAAGCA 


ATGTCTC CAC 


240 


ATCCCTTTAA 


TTTTATGTGT 


AATACATTTT 


TCGATACTTC 


AAAAGACATT 


CAAATACTAT 


300 


CAAGTTACTG 


TCATCAAAGG 


TTTTATTAAC 


TGATATTtTC 


ATATTTTTAa 


TCTGAATTTA 


360 
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(2) INFORMATION FOR SEQ ID NO; 251: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 964 bas pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 251: 





CCAGGGTGCG 


GAAAGCTTTA 


AAATTTGGAC 


TAATAAAGAT 


G CTGAT ATTA 


ATTCTATGAA 


60 


1S 


AACAGCAGTT 


TTACAACAAT 


TAAAAGGAGA 


ATAACATATG 


CTTACTGGcA 


AACAAAAAAG 


120 




ATACTTAAGA AGTTTAGCAC 


ACAATATTGA 


TCCGATTTTT 


CAAATTGGAA 


AAGGCGGTAT 


180 




CAACGAAAAT 


ATGATTAAAC 


AAATAGATGA 


TACGTTAGAA 


AACAGAGAAT 


TGATTAAAGT 


240 


20 


ACATGTACTA 


CAAAATAACT 


TTGATGATAA 


AAAAGAATTA 


GCTGAAACAT 


TAAGCGAAGC 


300 




TACTCATAGT 


GAATTAGTGC 


AAGTGATTGG 


ATCTATGATA 


GTGATTTATA 


GAGAATCTAA 


360 




AGATAATAAA GAAATTGAAT TGCCATAATA ATGAAAAAGA TAryACTTTA CGGCGGTCAG 


420 


25 


TTTAACCCTA 


TCCATACTGC 


ACATATGATA 


GTAGCTAGCG 


AAGTATTTCA 


TGAATTACAG 


480 




CCAGATGAAT 


TTTAmTlT 


ACCTAGTTTT 


ATGTCTCCAT 


TGAAAAAGCA 


CCATGATTTT 


540 




ATAGAOGTTC 


AGCACAGATT 


AACAATGATA 


CAGATGATTA 


TCGACGAGCT 


TGGTTTTGGA 


600 


30 


GATATTTGTG 


ACGATGAAAT 


TAAACGTGGT 


GGTCAAAGTT 


ATACCTATGA 


CACGATCAAG 


660 




GCATTCAAGG 


AGCAACACAA 


AGACAGTGAG 


TTGTACTTTG 


TTATTGGGAC 


GGATCAGTAT 


720 




AACCAACTAG 


AGAAATGGTA 


TCAAATTGAA 


TACTTAAAAG 


AAATGGTTAC 


TTTTGTAGTT 


780 


35 


GTAAATCGAG 


ACAAAAATAG 


TCAAAATGTT 


GAAAATGCTA 


TGATTGCAAT 


TCAGATACCT 


840 




AGGOTAGATA 


TAAGTTCGAC 


AATGATTCGA 


CAAAGAGTTA 


GTGAAGGGAA 


ATCTATCCAA 


900 


40 


GTTCTTGTTC 


CTAAATCCGT 


TGAAAACTAT 


ATTAAGGGGG 


AAGGATTATA 


TGAACATTGA 


960 


AAAA 












964 



(2) INFORMATION FOR SEQ ID NO: 252: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1193 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY r linear 

SO 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 252: 
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TTGTCATGAA ATAAATGGGA TGAATAT CAC GACTAGAAGT AATGTTACGA ACAGGAGCOT 120 

ATAAACTAGA GACGCTAAAT TCGACATAGT ATGTnGCTCA ATTATGGCTG ATGATGAATT 180 

5 TAAAGTATGT GCGTTGGAAC TGTCGGATTT TTGTTCATAA TGTTTTGCAT ATTGCGCCAT 24 0 

GATGAATAGT GTAAAAATAA ATAAAACAAT AAGAGATATA ATGCCCATAA TCAAAAGTAT 300 

TTGTTTAGAG CCTTTCATTA TTTCACATCC TTTCTAAAAT ATATTTGTAA CTAAATTTAA 360 

10 

AATAGTTATT TTTGTAATTC TAAACCTTTT TCATCGCGAA AACAATTAAA TAGGTCGCGG 420 

TATTAATTAT TATATTATTA CCGCTTAATA TGAAAAATAC ATGAaAATTA ATTTTCTAAT 480 

ATACTTTTGA AAAATTATTA CAAATTAGCC CCTTCAAAAC GCGAAAACAT AAGGATTCTA 54 0 

15 

GTTTCAAAAG GGCTGATAAG CATAAAATGA AATGTAATAT TTCGATGTAT AAAATTTTTA 600 

ATTAGCTAAA AATCATCGCA TTAATTTTTT GAGCTACATC ATCAAAATTC GGACATTTTA 660 

20 ACGACACATA TAATTTAATT TTAGGTTCAG TACCAGAAGG ACGTAAAGCG ATAAATCCTT 720 

CGTCAAATAA GACACGAATA ACATTTGATT TAGGAGAATT AATCTGCGAC GTTGTATCTT 780 

TATCCAAATG ATAAACCTOG CTAGTTAAAT AATCTTCAAT TGCTTTCACT TTGAGTCCTT 84 0 

26 GAATCTCTTG CGGTGGATTT GAACGGAATT TGGTCATTAT TGCATTAATT TTCTTTTTCC 900 

CTTCAAATCC TTCTAGCGTA TGOGgAATAA TGTATCCTCA TGTCTACCAA CAGTTTGATA 960 

AATCTGTTCT AATTCATCTT TCAATGTTTT GCCATATAAT TTTAACTCAG AAGCGTATTT 1020 

30 TATAATGAGT GGCACAATTT GTACGGCATC TTTATCACGT ACAAAAGGCT CTGATAGAAA 1080 

ACCGTAACTC TCTTCAAATG CGAAAATCAT ATTTGATGAT CATCCAGTTG TCTTATTTCC 1140 

TGAGCAATAA ATTTAAGCCC GTCAG CACCT CTTTGGTATT CAACATTATT ATA 1193 

36 

(2) INFORMATION FOR SEQ ID NO: 253: 

tU SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10 9 B base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



4S (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 253: 

TATCAGGATG ATTATGnCGG GGTTTTATTA AGTCTGAGCG TATATnCCTT TTATTCTCCT 60 

AAATGGTTTG GAATTCAAGG AGAAGACGAT GAAATGGTAT CCAAAAACCA AnGAATATAT 120 

60 nGCATTAAGT CTGAGGATGA TAGTGCGGTG GCAATTCGTT CATTAATTTT GCATAAAGAT 180 

GAACCTATGT ATTTAAAAAA ACGTACATGT GTACCTACTT TGTTAATTAA TGGGGAACAT 24 0 
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5 



10 



IS 



20 



AAAAAAATCT 


TCGAACATTC 


AGGACATGCA 


CCGCATATTG 


AAGAACCAGA 


AGCATTTATG 


360 


AATTATTATT 


TAAAATTTTT 


AAAAAGCGTA 


TCATAATATG 


TGATATATAA 


ACCTAGGGCA 


420 


TAAAGTCCTT 


AGGCAATGTG 


AAAAAGCTGA 


TTACTATTCA 


TTATTTGATA 


GAAATCAGCT 


480 


TrrrrrGAAA 


TGTATTTGAT 


ATATACTGCT 


CGTTATGCGG 


CTATCTTCCT 


TATATTAAGT 


540 


GCCATTAGTG 


CAAAACCTCT 


TAACAATTAG 


GTAAAAAGAG 


CATAAAAAAA 


GGAAGTTTAA 


600 


TAGAATOTAT 


CATCTATCAA 


ACTTCACCAA ATTGCGCTAA ACAAAATTAT 


AGTTCAATTT 


660 


CGTTGTTTGC 


TTCAGTGATT 


CGTTTATTTA 


CTOGACTCAA 


TAATGATTCG 


ATTTTTTTAC 


720 


GTTGTTGTGC 


ATTAACAAGA 


ATTAATACAG 


TTCTTTCATC 


ATGCTCATTA 


CGTTTTTTAT 


780 


CGAAGTAATC 


TTCTTCAGAT 


AAAATTTTAA 


CTGCTTTAAC 


AACTTGTGGT 


TGTTTGTAGT 


840 


TTAAATGATT 


AATAATATCt 


TTAAGATAGT 


ATTCTTTCTC 


TTTGTTTTCG 


CTGATGTATG 


900 


TCAATACAGC 


GAATTCTTCA 


AAGCTAATTG 


AnAATTCCTT 


TTTAATTAAA 


CTTTTTAATT 


960 


TGTCAGCATA 


AGTOACCATT 


GATAACAACT 


CAAAGCAATC 


ATTGATTTTT 


GTAATTGCCA 


X020 


TGTTTAAAAC 


CTCCCTATTT 


GATGCATCTT 


GCTCGATACA 


TTTGCCCOGA 


TAATATAnTG 


1080 


TATCTAATCT 


TTATGnAT 










1098 



(2) INFORMATION FOR SEQ ID NO: 254: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2881 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 254: 



40 



45 



SO 



CCAGGTAAAA 


TTGTGCAATC 


ATTTGACGCA 


TTAATGGACG 


CCTTGGACAA 


TGAAGATTAT 


60 


GAAGGAGAAA 


AAGTCATTCC 


ATTCTTAGAT 


AAACATTTTA 


AATATCAAGA 


TGGCCGATCA 


120 


AGTGAGCGTT 


TAGTCAGAAA 


TTTATTTGGT 


AGCTAAGTTT 


ATATAGTAGT 


CAAAGTGGGA 


180 


GAGGTATAAT 


GATGAAATTT 


TCAGTAATAG 


TTCCAACATr 


CAATTCAGAA 


AAGTATATAA 


240 


CAGAATTACT 


TAATAGCCTT 


GCGAAACAAG 


ATTTTCCGAA 


AACTGAATTT 


GAAGTGGTTG 


300 


TAGTTGATGA 


CTGTTCAACA 


GATCAAACGT 


TACAAATAGT 


TGAAAAGTAT 


CGCAATAAAT 


360 


TGAACTTGAA 


AGTAAGTCAA 


CTCGAAACAA 


ATTCTGGTGG 


TCCAGGTAAA 


CCTAGAAATG 


420 


kGGCGTTAAA ACAAGCAGAA 


GGTGAATTTG 


TATTATTTGT 


GGACTCCGAT 


GACTATATAA 


480 


ACAAAGAGAC 


TTTAAAGGAT 


GCAGCAG CAT 


TTATTGATGA 


ACATCACTCA 


GATGTCTTAT 


54 0 
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CACCTGAAGT TACTTTGTTA AATTCAAGAA 


TTATCTATAC 


TTTAAGOCCG 


ACTAAAATCT 


660 




ATAGAACAGC ATTACTAAAA GATAATGACA 


TTTATTTTCC 


AGAAGAATTA 


AAGAGTGCAG 


720 


6 


AAGATCAATT ATTTACAATG AAAGCATATT 


TAAATGCAAA 


TCGAATCAGT 


GTGTTAAGTG 


780 




ATAAAGCGTA TTATTATGCT ACAAAG CGTG 


AAGGTGAACA 


TATGAGTAGT 


GCGTATGTTT 


840 




CACCTGAAGA CTTTTATGAA GTCATGAGAT 


TGATTGCTGT 


AGAAATATTA 


AATGCAGATT 


900 


10 


TAGAAGAAGC CCATAAAAAT CAAATCTTAG 


CAGAATTTTT 


AAATCGTCAT 


TTTAGTTTTT 


960 




CTCGTACGAA TGGCTTCTCA CTTAAAGTTA 


AACTAGAAGA 


TCAACCACAA 


TGGATTAATG 


1020 


15 


CTCTAGGAGA CTTTATACAA GCAGTTCCAG 


AACGTGTAGA 


TGCATTGGTG 


ATGAGTAAAT 


1080 


TACGACCATT GTTGCACTAC GCGAGAGCGA 


AAGATATAGA 


CAACTATAGA 


ACTGTGGAAG 


1140 




AAAGTTACCG TCAAGGTCAA TACTACCGTT 


TTGATATTGT 


AGATGGTAAA 


TTAAACATTC 


1200 


£0 


AATTCAATGA AGGCGAACCA TACTTTAAAG 


GCATTGATAT 


CGCTAAGCCA AAAGTGAAAA 


1260 




TGACAGCATT TAAATTTGAT AATCATAAAA 


TTGTTACAGA 


GCTAACGTTA 


AATGAATTTA 


1320 




TGATTGGCGA AGGACATTAT GATGTCAGAC 


TTAAATTACA 


TTCACGAAAC 


AAGAAGCACA 


1380 


25 


CAATGTATGT ACCTTTAAGT GTCAATGCGA 


ATAAACAATA 


TCGTTTTAAC 


ATTATGTTAG 


1440 




AAGATATTAA AGCGTATTTA CCTAAAGAAA 


AAATTTGGGA 


TGTTTTCTTA 


GAAGTCCAAA 


1500 




TAGGTACGGA AGTATTTGAA GTGCGTGTTG 


GTAATCAACG 


TAATAAATAT 


GCATATACTG 


1560 


30 


CAGAAACAAG TGCATTAATT CATTTGAATA 


ATGATTTTTA 


TAGATTAACA 


CCGTATTTCA 


1620 




CAAAAGACTT TAATAACATT TCGTTATACT 


TTACAGCTAT 


TACATTAACG 


GATTCAATCT 


1680 




CATTGAAGTT AAAAGGTAAA AACAAAATCA 


TTTTAACTGG 


TCTGGATCGT 


GGTTATGTAT 


174 0 


35 


TTGAAGAAGG TATGGCTAGT GTOGTACTAA 


AAGACGACAT 


GGTGATGGGA 


ATGTTAAGCC 


1800 




AAACSTCAGA AAACGAAGTG CnAAATCTTA 


CTTAGCAAAG 


ATATTAAAAA 


GCGAGACTTC 


1860 


40 


AAAAATATTG TTAAGTTAAA CACTGCACAT 


ATCACTTATC 


CACTAAATAA 


ATAATAAATG 


1920 


CCCTCAAATC ATTGTGAGCC AACATGATTT 


GAGGGCTTTA 


TTTTGCTGTT 


TATGACATGA 


1980 




TTATGACATT TCCCTGATTT TCATTTTCAT 


ATACATTAAA 


TTGTATACAC 


TGGAAATGAG 


2040 


45 


GAGGTTATCT ATAATGATAA ATAAAAATGA 


CATAGTAGCA 


GATGTAGTAA 


CTGATTATCC 


2100 


GAAAGCAGCG GATATTTTTA GAAGTGTGGG 


AATAGATTTT 


TGTTGTGGCG 


GACAAGTAAG 


2160 




TATAGAAGCA GCAGCCTTAG AAAAGAAAAA 


TGTAGATTTG 


AAOGAATTAT 


TACAGCGTCT 


2220 


60 


CAACGACGTT GAACAAACGA ATACACCAGG 


TTCGTTAAAT 


CCTAAATTTT 


TAAATGTTTC 


2280 




ATCACTTATT CAATATATTC AATCAGCATA 


TCATGAACCT 


CTAAGAGAAG 


AATTTAAAAA 


2340 
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TGAGTTAAAA 


GAAACATACG 


ATACATTTAA 


AAATGGCATG 


TTAGAGCATA 


TGCAAAAAGA 


2460 




AGACGATGTC 


GATTTTCCAA AACTCATTAA ATATGAGCAA GGTGAGGTAG 


TAGACGATAT 


2520 


5 


TAATACTGTG 


ATAGATGATT 


TAGTTTCAGA 


CCACATTGCA ACGGGAGAAT 


TGTTAGTAAA 


2580 




AATGAGCGAA 


TTAACATCTA 


GTTATGAACC 


TCCGATAGAA GCGTGTGGTA 


CTTGGCGACT 


2640 


10 


TGTTTATCAG 


AGATTAAAAG 


CACTTGAAGT GTTAACACAT GAACACGTAC 


ATTTAGAGAA 


2700 


TCACGTATTA 


TTTAAAAAAG 


TATCATAAAT AACGCGATTA GAAACTGTTG 


GCAAAAATAA 


2760 




GTCCAGCAGT 


TTTTCGCTAT 


GTATAAAAGT 


CATAATAGTG 


ACATAAACAG 


CATTATTTGA 


2820 


15 


AAAGAAnAAT 


GGTCAACTTA 


GCATAAAAAT 


TGATATGAAn ATTTAATGGT 


ATAGATAATT 


2880 


A 












2881 




(2) INFORMATION FOR SEQ ID NO: 2S5: 








20 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1056 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDBDNESS : double 

(D) TOPOLOGY : linear 






- 


25 


(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 255: 








ACCGTCGAAT 


ATCGCTTGTG 


ATTTACAATT 


TGTGTATTAA GATGCTCAAC 


-TAATTTGGGT 


60 


30 


ACATATTCCG 


AATTTAGATT 


TGCAAGTACA 


ACAATTCCAT 


AATTTTGTTT 


TGGATTTAGT 


120 




AAAATAAATG 


ATGAAAAGTT 


ATCTAGCGTT 


CCTGAATGAA ACACTAAATG 


TTCATCATTA 


180 




TTGGTAAACC 


AGCCGGAAGC 


ATATGCATTG 


GCATTAGGTT 


CACCAATTGT 


TGAAGATAAA 


240 


35 


- TTTTTATGTG 


ATTGTTGAAC 


TAATGATTTG 


TATTTATCAG 


GTGGATTAAG 


TTGGAATTTT 


300 




ATCGAATGTT 


CCAAATCTTC 


AGTTGATGTC 


ATCATATATG 


CTGATGGTGT 


ATCCCAAAGG 


360 


40 


TTAAATTCAG 


GTTTAGAGAC 


GACAGGTGTC 


GAACCTTGTA 


ATTCATAGCC 


AATAGCATCA 


420 


TGTTTTGATT 


TGTAATTGGT 


TTGTTTGAAT 


GATGTATGTG 


TCATATGCAA AGGCTTGAGC 


480 




CATGAATTTG 


TAATATATTT 


TGTATAGGAT 


TGCTTCGTAA 


CGTTTTGGAT 


AATTAAACCT 


540 


45 


AATAAATCAT 


AGTTCATATT 


TGAGTATTCA 


AATTCTTCTC 


CGGGCTTATG 


ATGTAATTCA 


600 


TCACCCATAA 


TTGCATGGGT 


TACATCATTT 


AAACGATTAT 


TTTTGCTTGT 


CACAGAATCT 


660 




tCGCTTGTAA 


TAtCACTAGG 


TATACCACTT 


GTTTGAGCCA 


AAAGTTGCTT AATCGTAATA 


720 


SO 


GTTTCATTTT 


GACCATTATA 


GTTCATTTTA 


AAATGAGGCA 


CATGTTTGGA 


TACGGCATCA 


780 




TTTAAGTTTA 


ATCGACCTTC 


TTGAGCTAAT 


TTTAAAATTG 


CAAGACCTGT 


GAAAGCTTTC 


840 
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10 



15 



20 



35 



40 



45 



50 



TGATAACCAT AACCTTTATT TAAAAAAACT TTGCCATTTT TTACTAyTAA AATTGATGCT 960 

CCAGGAATGT GTCCCTTTTG TAAATCATGC TCGATAATTO TATCTATTTG TTGTTGCGAA 1020 

TCATTGGTTA ACCGTGTCTT OGTATTGCTA TTTAAT 1056 
(2) INFORMATION FOR SEQ ID NO: 256 : 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1277 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 256: 

ATGCCaCACT TATTGGTGGC AGGATCGACG GGTAGTGGTA AATCTGTTTG TATAAATGGT 60 

ATTATTACAA GTATTTTATT AAATGCTAAG CCGCATGAAG TTAAACTTAT GTTAATCGAT 120 

CCGAAAATGG TTGAACTAAA TGTTTATAAC GGAATTCCAC ACTTATTAAT TCCGGTTGTT 180 

ACAAATCCTC ATAAAGCTGC TCAAGCTTTA GAAAAAATTG TAG CTGAGAT GGAAAGACGT 240 

25 TATGATTTAT TCCAACATTC ATCAACTAGA AACATTAAAG GTTATAACGA ATTAATCCGT 3 00 

AAGCAAAATC AAGAATTAGA TOAGAAGCAA CCAGAATTAC CTTATATCGT TGTTATTGTA 3 60 

GATGAGCTTG CAGATTTAAT GATGGTAGCT GGTAAAGAAG TTGAAAATGC GATTCAACGT 420 

30 ATTACACAAA TGGCACGTGC AGCAGGTATA CATTTAATTG TAGCGACACA AAGACCTTCT 4 80 

GTGGATGTAA TTACAGGTAT CATTAAAAAT AATATTCCAT CTAGAATAGC TTTTGCTGTG 540 

AGTTCTCAAA CAGATTCAAG AACTATTATT GGTACTGGCG GCGCAGAAAA GTkACTTGGT 6 00 

AAAGGTGACA TGTTATACGT TGGAAATGGT GACTCATCAC AAACACGTAT TCAAGGGGCG 660 

TTTTTAAGTG ACCAAGAGGT GCAAGATGTT GTAAATTATG TAGTAGAACA ACAACAGGCA 720 

AATTATGTAA AAGAAATGGA ACCAGATGCA CCAGTGGATA AATCGGAAAT GAAAAGTGAA 780 

GATGCTTTAT ATGaTGAAGC GTATTTGTTT GTTGTTGaAC AACAAAAGGC aAGTACATCA 840 

TTGTTACAAC GCCAATTTaG AATTGG t TAT AATAGAGCAT CTAGGTTGAT GGATGATTTA 900 

GAACGCAATC AGGTAAT CGG TCCACAAAAA GGAAGCAAGC CTAGACAAGT TTTAATAGAT 960 

CTTAATAATG ACGAGGTGTA AAAAAATGTC AGAAATGAAT GCGGTATATA ACGTTAAACA 1020 

ATaCATTTtA AATTTgATTA AGCAAAATAA ATTGGAATAT GGTGACCAAC TTCCAAGTAA 1080 

TTTATCAATT GCCAGAGAAT TAAATGTAAA AACCGACGAT GTTTATGAAG CAATTCAGcA 1140 

TTGATTACTG AACAAGTCAT TAAAGATA t T TTGAAGAGGG CACAAGTGTT AAGTCACTGC 1200 
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GrtTTGAATG CGGAACT 1277 
(2) INFORMATION FOR SEQ ID NO: 257: 

5 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 35S7 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 257: 



20 



25 



35 



SO 



TACCGTCGTT 


TTATGyGTCA 


AATTTTACAG 


TAAATTTTGC 


TTCATCAAAA 


GAAATAACCT 


€0 


TTAACAAGTA 


TAGTAATTTT 


ACATTTTACA 


ATGTTACAAA 


ATATAATTTT 


TTATAATTAG 


120 


TTAAAATCAC 


TAAAACGCTT 


TTATACACTA 


TCAAATCAGC 


ATTTATAAAA 


ATATGAACCG 


180 


ATATCCTAAA 


ATGTTAATAA 


TATTACAAGA 


TAATAACArA 


CCACACAAAG 


CTACTTATTT 


240 


TTGATAATAT 


GGAAATCGTA 


ATATAAAACn 


AAAACTTAAT 


TTACTATATA 


AATTGTCTTA 


300 


ATAATTTTTA 


AAAGTAGTAA 


AACATAATTT 


TAAGGAGGAG 


TCCCTTTGAA 


AAAATTAGCA 


360 


TTTGCAATAA 


CAGCAACATC 


TGGTGCAGCT 


GCATTTTTAA 


CGCATCATOA 


TGCACAAGCT 


420 


TCTACACAAC 


ATACAGTACA 


ATCTGGTGAA 


TCATTATGGA 


GTATTGCTCA 


AAAATACAAC 


480 


ACTTCAGTAG 


AGAGTATTAA 


ACAAAATAAC 


CAATTAGATA 


ACAACTTGGT 


ATTCCCTGGT 


540 


CAAGTTATCT 


CAGTAGGTGG 


AAGTGATGCA 


CAAAATACGT 


CAAACACTTC 


TCCACAAGCT 


600 


GGTTCAGCAT 


CATCTCATAC 


TGTACAAGCT 


GGTGAATCAT 


TAAATATCAT 


TGCTAGCAGA 


660 


TATGGTGTTT 


CAGTTGATCA 


ATTAATGGCA 


GCCAATAACT 


TACGTGGTTA 


TTTAATTATG 


720 


CCTAACCAAA 


CATTACAAAT 


TCCTAATGGT 


GGATCAGGTG 


GTACAACACC 


AACAGCTACA 


780 


ACA<2STAGCA 


ATGGCAATGC 


ATCATCTTTT 


AATCACCAAA 


ATTTATACAC 


TGCTGGTCAA 


840 


TGTACATGGT 


ACGTATTTGA 


CCGTCGTGCT 


CAAGCTGGTA 


GTCCAATTAG 


CACATATTGG 


900 


TCAGACGCTA 


AGTATTGGGC 


TGGTAACGCA 


GCTAATGATG 


GTTACCAAGT 


AAACAACACA 


960 


CCATCAGTTG 


GTTCAATTAT 


GCAAAGCACA 


CCTGGTCCAT 


ATGGTCATGT 


TGCTTATGTT 


1020 


GAACGTGTCA 


ATGGTGATGG 


TAGTATCTTG 


ATTTCTGAAA 


TGAATTACAC 


ATATGGTCCA 


1080 


TACAATATGA 


ACTACCGTAC 


AATT CCAGCT 


TCAGAAGTTT 


CTAGCTATGC 


ATTCATCCAT 


1140 


TAATTAAATA 


AATTGTACTG 


ATATATACTA 


GCAATTCACA 


TCATGTGAGA 


TTGCTAGTTT 


1200 


TTTATTTTTG 


AAAAAAATTT 


TCATTTTGGT 


ACAAAAAATT 


ATCTCACCCT 


TCCCTATCAT 


1260 


ACATATTTAT 


ATTTTGTATG 


AATGGTAGTT 


AGGTAAAAAT 


TAACAACCTA 


CCTATTTGAT 


1320 
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ATTTAATTTG 


TTATACCAGT 


ATTTTACGCT 


TTTTCGTCTA 


CATATACAAA 


TTTATATTAA 


1440 




ATAAAGCCCA 


ATACAATTTA 


GGTTAATTAA 


ACAAGTTGAT 


AACTATTTAA 


TTATTCCTTC 


1500 


5 


ATTGAAGAAT 


ATAAACTATT 


AAATCATTAT 


TTTGCTCTTA 


CATATATTTT 


AATGACCTAA 


1560 




CTGaTTATOT 


TCCATGGAAT 


ACATTTATAA 


TATAGCCTCC 


TAATTAArAT 


GCyTTGTCTT 


1620 




GGTCATTCTA 


CGTAAATTCT 


ATAAAATATG 


TTATCTACTT 


ACATAArAm 


CTGrACTTCA 


1680 


10 


ATACCACCAT 


ATGTTTGTGA 


TACTGAAGTT 


CAGTTTAGTT 


TTATTTTCAA 


TTAGAAAAAT 


1740 




AAGTTAAGTA 


TATAGAATAG 


TAAACCTGCT 


AACAATGCTG 


AAATAGGTAA 


TGTAATCACC 


1800 


15 


CATGTAATGA 


TCATTCGTTG 


CGCAgTGCTC 


CATTTTACAC 


CTTTAGCTCG 


GTTAGAAGCA 


1860 


CCAACACCTA 


AGATTGATGA 


TGACACAACG 


TGAGTTGTTG 


ATAATGGGAA 


ATGTAGCGAT 


1920 




GATGCAACAA 


AAATTGTTAA 


TGCAGATGAT 


AAATCGGCCG 


CAGCACCATT 


TGCTGGACGT 


1980 


20 


ATTTTCATAA 


TATTACCACC 


TACAGTTTTG 


ATAATTTTCC 


AGCCACCAAT 


TGCAGTACCA 


2040 




AGCCCCATTG 


CTGTCGCACA 


GG CAAATTTT 


ACCCATAACT 


GTGGTTCAAC 


ACTGCCATCA 


2100 




TTCTGTACAT 


TAGCGACAAT 


CAATGCCAAC 


GTAATAATAC 


CCATTGATTT 


TTGCGCATCA 


2160 


25 


TTCGTACCGT 


GAGAGAATGA 


TTGTAACGCT 


GCTGTGAAAA 


TTTGGAAAAA 


TCTAAAGTTA 


2220 




CGATTCGCTC 


TTGTTAAATT 


TGCATTTTTA 


AAGATAACTT 


TAAAAATTGA 


ATACATCAAG 


2280 




AAACCAACAC 


AAAATGCGAT 


AATCGGTGAA 


ACGATTAATA 


CAATAATAAT 


TTTTGTGAAA 


2340 


30 


CCTTGGTAAT 


GTAACACTCC 


AAATGAGCCT 


TCAG ATG CGA 


TTGCTGCACC 


CGCAATTGAA 


2400 




CCTATAAGTG 


CATGTGAAGA 


CGAACTTGGA 


ATTCCGTAAA 


ACCAAGTAGC 


TAAATTCCAA 


2460 




ATAATAGCCG 


CAAGTATTGC 


AGCTAACACA 


ACAACTAATC 


CATTTTCCAA 


TTTAAATGGA 


2520 


35 


TCGACAATGT 


CTTTAGTAAT 


GGTGCCTGCA 


ACGCCCGTAA 


ATGTTAAAGC 


ACCTATAAAG 


2580 




TTCATCACTG 


CTGCCATTAA 


AATTGCCGTT 


TTAGGgTTAA 


CGCTCTAGTA 


GATACAGCAG 


2640 


40 


TAGCTACTGC 


ATTGGcTGTA 


TCATGGAaTC 


CCATTGATAA 


AGTCAAATAT 


CAGCGAGAAA 


2700 


ATAACTACAG 


CTATAGTGAC 


GATGATTATA 


TATGACATAA 


ATATATACTC 


CCCTTAGCTA 


2760 




TTTTTCATAA 


TAATAGTTTC 


AAAATTATTT 


GCTACGATTT 


GACATTTATC 


AGCGATTTCT 


2820 


45 


TCCATGCTTT 


CATAAATATC 


TTTTATTTTA 


ATTAAAGTGA 


TTGGATCTGT 


TTCGCTATTG 


2880 


AAAATATGTT 


TAATTGACTG 


TCTTAAAATA 


CCATCACAGT 


TTGTTTCAAA 


TTCTTTAATA 


2940 




TTAATTGAAT 


GAATACGCAT 


ATGTGATAAT 


TTTTTATCGA 


CTAATAAGCC 


GACAGCAAGT 


3000 


60 


TTCATTTCTG 


CAACTGCTTT 


TTGAATGTTA 


TCAACAAACT 


CAGCCATATA 


TTCATCTGTG 


3060 




TATTCGATTG 


AATACATTTC 


AAACATrGCT 


GCCGTTTCTT 


CAATTGCATC 


TAAAACATCA 


3120 
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TTTAAATCAG TAATTACTTG ATGTACTAAt tCGcACCATG TGACTCATAA GTTTTAATGT 3240 

TGTCTGAGTA TGCTTTTAAA TCTAAATGTG TATTGAAATC CATTTTACCG AATTCAATAG 3300 

CAGCACGATC CAGATTGAAA ACCATCTCTT CTAATTGAAC CATAAACTTA TCTTTTTTCT 3360 

TACTAAACAT TTAAAATCCT CCATTTAAGC GATTGTCACC AATCACATTC AGTTATAATT 3420 

TGTTTCAAAT TAAGACAAGT GAATTTACAA ACTAATGATA CAAATTTGTT ATTATCAATC 3480 

GTCAGTATAA TTTTAGTGTA CTGATATTAA TTTCAAAAAT GCCTCACAGT AAACAATTTA 3540 

CTGTATTTGC CCTTATA 3557 



(2) INFORMATION FOR SEQ ID NO: 256: 

IS 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1631 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

20 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 258: 
AACTATACAT TTCGAAAAAT TCTTCTAGTG AACCTGCGCC ACCAGGAGCC ATGACAAATG 60 

CO 

CATCTGCAAG TTCTGCCATT TTATTTTnAC GTTCATGCAT AGAATCAACT AAAATTAATT 120 
CAGTTAAACG TTGGCTTGTG ATTTCATGTT CATCTAACAT TTTAGGCATG ACGCCAATAG 180 

30 CTTTGCCGCC ATGATCTAAT ACACCATCTT GaATGGCACC CATAATGCCA ATTGACCCTG 240 
CAC CAAAT AC TAATTCATAA CCTTGTTCAG CAAAATATTT ACCTAAATCG TATGCTTTTT 300 
GTACATATGA AGGGTCATGA CCTTTGCTTG CACCACAATA AACTGCGATT CGTTTCATGT 360 

35 TAATCCAGCT CCTTAATTCG ATGAATGACT TTTAATAGTG ATTGTTCAAA CACTTTTTGA 420 
TCTTGCTTTG TAAAAGGTGG GGGACCTTTG TGGCGACCAC CTTGTTTTCT AATTTGTGCA 480 

TTCATATATC GTTTATCTAA TAGTTGTTGA ATATTTTTGG AATTGTATAT CTTCCCATTA 540 

40 

TGATGCATGA CAATTAAGAC TTTGTCGACT AATAAACTTG CGAGTCCATA ATCTTGAGTG 600 

ACTACGATAT CATCCTTCGT TGATAATTGA ACAATTTTGT AATCAACTGC ATCTGGTCCA 660 

TCATCAACAT ATAATGTTGA TACATGTGGA GGATATAATT GGTTCGAAAA ATGGCTGAAG 720 

45 

CTCCGAATAA TTGTCACAAA AATGCCTGTC TCAGTTGTTA AATCTATAAT AGAATCAACA 780 

ACAGGACAAG CATCTCCATC AATAATAATA TGTGTCACAA TTATGCCTCT GTATTGTTTT 840 

CTTTATTTTG TTGAGAGGCG CTTTTGGCAA CATAATCTTT ATATTTTTTA AATGACTTGA 900 

SO 

TGCGTGCTTT ATCAGCTTCT TGTTGGCGTT TTTGTTCTTC TTTGTGTCGT TTTTCAATAT 960 

ss 
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5 



10 



15 



CGCCTTTTTT 


CTCAGTTTTC 


TCATCTAATT 


T ATT AGO TOT 


TAAGCCTGCT 


TTTTCTTCGT 


10BO 


ATTTTTGTGA 


TTTTTTCATA 


TCTTTAATAC 


GTTGTATTTC 


ATTCTTTTCG 


CGGGCTTTTT 


1140 


GCTCTTCTTT 


ATGACOCTTT 


TCGATATTTT 


TTTGAAGTAT 


TTTATTCATT 


TTATCAGCGT 


1200 


CTTTACGATT 


TTGTTTAGCT 


AATTTTTCGC 


CTTTTTTCTC 


AATATAGGCA 


GGATCATGTT 


1260 


CTCTAGCAAA 


CTTTTTAAGT 


TCACGTTTAT 


TTTCAAAATC 


ttutttttta 


TCGCCGACAT 


1320 


ATTCTTTAAC 


ATCACTCGCT 


GTGTTACTGA 


TTGCTGCAGA 


TGTTTTTGAA 


GCAACTTTAC 


1380 


TTGTAGCATC 


TGTAACTTTT 


TGTACGTCCG 


GATGTTGTTT 


GATACGTTTA 


CGTTCAACAA 


1440 


TTAACGGTAC 


CAATACAATT 


GGTAATACAT 


TAATCATAAA 


TTTGATGACT 


TTTTTCTTAT 


1500 


CCATAGATCT 


TGc CTCCaTA 


ATTACTTTAT 


TAAtTTTACa 


TACCCtATGa 


TACATCAATA 


1560 


TAAACGATGA 


TAGTAGTGAA 


TCACTATTAA 


GTATTTCAGA TGTTTtTTAA AAgaAGaCCC 


1620 


AATTAnAAAA 


A 










1631 



(2) INFORMATION FOR SEQ ID NO: 259: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6645 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



30 ( X i) SEQUENCE DESCRIPTION: SEQ ID NO: 259: 



35 



40 



45 



SO 



CGAAATCATG 


ATTTAATGCT 


TTTTCATATA 


AGCTTTTCCA 


ATTAATCTTT 


CGTCCATGAT 


60 


ATTCTTCAAC 


TGTTGCTAGA 


TATTGTGCAA 


TTTTAGTTAC 


TTTAAAGGAG 


TGTGCTGCAA 


120 


CaTTGTGkTC 


mAAATATTTA 


AATTTTCCaG 


GtAATCTTAT 


AAGTCTTTCC 


aTATCTGATA 


180 


ATCT£TTAAA 


ATATTGATGT 


ACACCCATTT 


CAATTACCTC 


CTCCATTAAT 


TAATCATAAA 


240 


TTATACTTTC 


TTTTTACATA 


TCAATCAATT 


AAATATCATT 


TaAATATCTT 


CTTTaTATAA 


300 


cTCTGATTAA 


ATGATACCAA 


AAAATCCtCT 


CAACCTGTTA 


CTTAAACAGG 


CTAAGAGGAT 


360 


AGTCTTGTCT 


TGATATATTA 


CTTAGTGGAT 


GTAATTATAT 


TTTCCTGGAT 


TTAAAATTGT 


420 


TCTTGAAGAT 


TTAACATTAA 


ATCCAGCATA 


GTTCATTTCA 


GAAACAGTAA 


TTGTTCCATT 


480 


AGGGTTTACA 


GATTCAACAA 


CACCAACATG 


TCCATATGGA 


CCAGCAGCTG 


TTTGGAAAAT 


540 


AGCGCCAACT 


TCTGGTGTTT 


TATCTACTTT 


AAATCCTGCA 


ACTTTTGCTG 


CGTAATTCCA 


600 


GTTATTTGCA 


TTGCCCCATA 


AACTTC CTAT 


ACTTCTACCT 


AATTGTGCAC 


GACGATCGAA 


660 


AGCATAATAT 


GTGCAGTTTC 


CAT AAG CAT A 


TAAGTTTCCT 


CTGTTAGCAA 


CTGATTTATT 


720 
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TACATTAACT GTCTTAGTTA CTGCTTGCTT AGGTGCTTGC TTAACTACTA CTTTTTTAGA 840 

TOCTTOTTGT ACAGGTTGTT TTACTACCTT TTTAGCTTGG CTTOCTTTTC TTACTGGTGA 900 

6 TTTAACCGCT TTAGTTTGTT TCACTTTATT TTGAGGCACA AGTGAAATCA CGTCACCAOG 960 

AAAAATTAAA GGTGTTACAC CAGGATTGTA TGAATATAAT TGATTCAACG TTAAGTGATG 1020 

CTCTAAAGCA ATCTTATATA ATGAATCGCC AGCAACTACT GTATAAGTTG TCGGTGATTG 1080 

10 

CGTTTGTGCT TGAACATTTG ATACATAATT ATGTTGAACA GGTGTTTTTA CTTGTGTGCC 1140 

ATGTTGTTGT GCATGTGCTO CATTATTTAA AGCTAAAAAA GCTAACACTG ACGAAACCGT 1200 

CACTGTAAGA GATTTTTTCA TCTTGCTGTC ATTCCTTTGC TGTTAGTATT TTAAGTATGC 1260 

1S 

AAATACTATA GCACAATACA TTTTGTCAAA AGCTATTGTT ATAACGATGT AATCAAATGG 1320 

TTAACAATAT AAAAAGAATA CAACCTTTTA TCATAGTGTA AAATGTATTC ATACCATGTA 1380 

^ ATTGAGAACG TTTTCAATAA TTAATTCAAT ACCTTGAAAA TCGCCATAGG TAATATTACT 1440 

AAATGCACAC TGCATATGTT GTTTTAACAA ACACAACTTT TAAAAAATAT ATTCTAACTC 1S00 

TATCTACCGA ATTGTACTTA AATATTCATA AACAAATCAT ATTCCAAAAT CTAATTTACA 1560 

25 ATTTATTTAG CTACCTTTAA AAAAACCAAA AACCGACGCC CTTTTAGAGC CTCGGTTTTA 1620 

AAATATATAT TAATCGTGCG ACATTGTCTG TCTTAAATAT GATTCGATAA ATGGTCCAAT 1680 

GTCTCCATCC ATCACTG CAT CAACCTTACC TGTTTCTTCG TTCGTACGAT GATCTTTCAC 1740 

30 CATTGAGTAT GGATGGAAAA CATATGATCT AATTTGGCTT CCCCAGCCGA TTTCTTTTTG 1800 

TTCGCCACGA ATTTCAGCCA TTTCACGTG C CTGCTCTTCC AATTTTAATT GATATAATTT 1860 

AGACTTTAAC ATTTTCATAG CTGCTTCACG GTTTTTAATT TGAGAACGTT CATTTTGGTT 1920 

35 

ATTAACAACT ATACCTX3AGG GGTGGTGGGT AATTOGTATT GCGGATTCAG TTTTGTTAAT 1980 

ATGCTGACCA CCTGCACCAG AAGCTCTGAA TGTATCAACT GTAATATCAT CCGGATTGAT 2040 

TTCAATCTCT ATTTCATCAT TATTAAAATC TGGAATAACG TCGCATGATG CAAATGATGT 2100 

40 

ATGACGACGT CCTGATGAAT CAAATGGAGA AATTCGTACT AGTCGGTGTA CACCTTTTTC 2160 

AGCTTTTAAA TAACCATAAG CATTATGCCC TTTGATGAGC AATGTTACAC TTTTAATCCC 2220 

CGCTTCATCC CCAGGTAGAT AATCAACAGT TTCAACTTTA AAGCCTTTCT TCTCACAATA 2280 

45 

ACGTTGATAC ATTCTAAATA GCATATTAGC CCAATCTTGA GACTCCGTGC CACCTGCACC 2340 

AGGATGTAAC TCTAGAATTG CGTTATTGGC ATCGTGAGGC CCATCTAATA ATAATTGCAA 2400 

60 TTCGTATTCA TCCACTTTAG CCTTAAAATT AATGACCTCT TGCTCTAAGT CTTCTTTCAT 2460 

TTCTTCATCA AATTCTTCTT GTAATAAATC CCAAGTAGCA TCCATGTCAT CTACTTCTGC 2520 

55 



1055 



EP0 786 519 A2 





TTGOGCTTTC 


GTTTGGTTAT 


CCCAAAAATT 


AGGTTCTGCC 


ATCATTTCTT 


CATATTCTTG 


2640 




AATATTAGTT TCTTTGTTCT CTAAGTCAAA GAGACCCCCT AATTTGTGTT AAATCTTOAT 


2700 


s 


TATACTTATC 


TATATTTCGT 


TTGATTTCTG 


ATAATTCCAT 


AG C ATTCGCT 


CCTATTTATA 


2760 




TTTCAATTCA AGTCATTGAT 


TTGCATCTTT 


TATAATGCTA 


AATTTTAACA 


TAATTTTGTT 


2820 


10 


AAATAACAAT 


GTTAAGAAAT 


ATAAGCACAC 


TGACAATTAG 


TTTATGCATT 


TATTGTTAAA 


2880 


AATCAGTACA TTTATCATCG ACATATGCCT AAACCGATTT TTTAAAACTA 


AGTACATAAC 


2940 




AACGTTTAAC 


AACTTCTTCA 


CATTTTTTAA 


AGTATTTAAC 


GCTTGTAAAA 


TAAAAAGACT 


3000 


15 


CCTCCCATAA 


CACAAACTAT 


AGGTGTTTAA 


TTGGAAGGAG 


TTATTTTATA 


TCATTTATTT 


3060 


TCCATCGCAA 


TTTTTGAATT 


TTTTACCACT 


ACCACATGGA 


CAATCATCGT 


TACGACCAAC 


3120 




TTGATCGCCT 


TTAACGATTG 


GTTTCGGTTT 


CACTTTTTCT 


TTACCATCTT 


CAGCTGAAAC 


3180 


20 


GTGcTTCGCT 


TCACCAAACT 


CTGTTGTTTT 


TTCACGTTCA 


ATATTATCTT 


CAACTTGTAC 


3240 




TACAGATTTT 


AAAATGAATT 


TACAAGTATC 


TTCTTCAATA 


TTTTGCATCA 


TGATATCAAA 


3300 




TAATTCATGA 


CCTTCATTTT 


GATAGTCACG 


TAATGGATTT 


TGTTGTGCAT 


AAGAAGGTAA 


3360 


25 


GTGAATACCT 


TGACGTAATT 


GATCCATTGT 


GTCGATATGA 


TCAGTCCAAT 


GGCTATCAAT 


3420 




AGAACGAaGT 


AAAATCATAC 


GCTCAAACTC 


ATTCATTTGT 


TCTTCTAAGA 


TATCTTTTTG 


3480 




ACTTTGATAT 


GCTGCTTCAA 


TCTTAGCCCA 


AACGACTTCG 


AAAATATCTT 


CAGCATCTTT 


3540 


30 


ACCTTTGATA 


TCATCCTCTG 


TAATGTCACC 


TTCTTGTAAG 


AAGATGTCAT 


TAATGTAGTC 


3600 




GATGAATGGT 


TGATATTCAG 


GCTCGTCATC 


TGCTGTATTA 


ATATAGTAAT 


TGATACTAOG 


3660 




TTGTAACGTT 


GAACGTAGCA 


TTGCATCTAC 


AACTTGAGAG 


CTGTCTTCTT 


CATCAATAAT 


3720 


35 


ACTATTTCTT 


TCGTTATAGA 


TAATTTCACG 


TTGTTTACGT 


AATACTTCAT 


CGTATTCTAA 


3760 




gata£gttta CGCGCGTCGA AGTTATTACC 


TTCTACACGT 


TTTTGTGCTG 


ATTCTACAGC 


3840 




TCTTGATACC 


ATTTTTGATT 


CAATTGGTGT 


AGAGTCATCT 


AAACCTAGTC 


GGCTCATCAT 


3900 


40 


TTTCTGTAAA 


CGTTCAGAAC 


CAAAACGAAT 


CATTAATTCA 


TCTTGTAATG 


ATAAATAGAA 


3960 




GCGACTATCC 


CCTTTATCAC 


CTTGACGTCC 


AGAACGACCA 


CGTAACTGGT 


CATCAATACG 


4 020 


45 


ACGAGATTCA 


TGTCGCTCTG 


TACCTATTAC 


TGCTAAACCG 


CCTAATTCCT 


CTACGCCTTC 


4080 


ACCTAATTTG 


ATATCTGTAC 


CACGACCAGC 


CATGTTAGTG 


GCAATAGTAA 


CGGCACCTTT 


4140 




TTGTCCAGCG 


CCTGCAACAA 


TTTCAGCTTC 


ACGTTCATGA 


TTTTTCGCAT 


TTAACAGATC 


4200 


60 


ATGACGGATA 


CCACGTTTTT 


TAAGTAAATT 


TGAAATATAT 


TCAGAAGTCT 


CAACTGCAAC 


4260 




AGTACCTAAT 


AGCACTGGTT 


GCCCTGCCTT 


GTGTTTTTCA 


ACAACATCTT 


CTACTACTGC 


4320 
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TTTATTTGTC GGAATTTGAG TTACTGTCAT GTTATAAATA TTTCTAAATT CTTCTTCTTC 4440 

AGTTTTAGCT GTACCTGTCA TACCCGCAAG TTTATTGTAC ATTCTGAAAT AGTTTTGGAA 4500 

6 TGTAATAGAC GCCATAGTTT TAGATT CATT TTGAATTTGA ACGCCTTCCT TCGCTTCAAT 4560 

AGCTTGGTGT AAACCTTCCG AGAAACGACG GCCTGGCATT GTACGTCCTO TAAATTGATC 4620 

GACAATTAAT ACTTCGCCAT CAACAACCAT ATAGTCTACG TCACGTTGTA ATGTAACGTG 4680 

10 

CGCACGTAAA GCTGTGTTGA TATGACTAAT AACATCAACA TTTTGTACAT CATATAAGTT 4740 

TTCAACTTTG AACATACGTT CAGCTTTATC CGCACCTTGT TCTGTTAAAT GTACAGCTTT 4800 

CGTTTTTTCA TCGTATTTAT AATCTTCGTC CTGTTTTAAC ATTTTCGCAA AAACATTTGC 4660 

TTGTGTATAA AGTGACGTTG ACTTTTCAGC TTCACCAGAA ATAATTAATG GCGTACGTGC 4920 

CTCGTCGATT AAAATTGAGT CAACCTCATC AATGATTGCA AAATGTAATG GACGCATTAC 4980 

TCTATCTTCA GAATAATTCA CCATGTTATC TCGTAAGTAA TCAAAACCTA GCTCATTATT 5040 

20 

AGTACTGTAA GTAATGTCTT GTGCGTATGC TTCACGTTTT TCTTCTGTCG TCTTACTGTT 5100 

TAAGTTTAAT CCGACAGTCA AACCTAAGAA GTTATATAAC TCAGCCATTT CTTCACTTTG 5160 

25 AACACTTGAT AAGTATTCAT TGACTGTAAT . AACGTGAACA CCTCTACCAG CTAATGCATT 5220 

TAAGTATGTT GGCATTGTCG CTGTTAATGT TTTACCTTCA CCTGTTCTCA TCTCAGCGAT 52 80 

ATCACCTTTA TGAATTGCAA TACCACCCAT AATTTGAACT TTATATGGTG TCATATTGAA 5340 

30 TACACGTTTA GAGCCTTCTC TAACAAGTGC ATATGCTTCT GGTAAAATTT TATCTAAATA 54 00 

ATCATTTTGC TTTTTGACAT TATCAATGTC AGCTAATTCT GTTTGGAATT GTTTCGTTTT 5460 

ATTACGAATT TCTTCATCAG TTAAAATTGC CGTTTTTTCT TCTAAAGCGA TTACTTTATC 5520 

35 AGCAAGTTTA CCTAACTGTT TAATTTCTTT ATT ATTGCCA TCAAGAATTT TTGATAAAAA 5580 

TCCCATTTCG TTCGCTCCTT TAGCTAAAAA ACTGTTTGGC CTACAACAAT ATATCTTATC 5640 

ATTTATAGTT AGAAAATTAT ACTTATTTAC TCATTTGTAG AATCAATATA AATATATTTA 5700 

40 TGACATACTT CATTCACATT CTGTTGTCAA CAAGTTTATC ACTAATAAAT ATATTCTCAA 5760 

TACGCAATTA TACTTCCTAA TAAATTATAT TATAAATATT TTACGATTTT CGACTCGGAC 5820 

TATACAATAG ACTGACATAC TATTATTAAC TTAACATTCA AATATATACA TCCATTAACA 58 80 

45 

TTAGCATAGT CACTATGTTT CATTCAACAA ATTACATTAT CGAACTATGA AAT AG TCAT A 594 0 

ATTTGCTTTT GGAGTATAAA AAAGCACTTG TGCAAAAACA CAAGTGCTTT AAACTTAATT 6000 

TATTGTTCAC TAGTTTGAAT CAAGCCATAT TTACCGTCTT TACGGCGGTA AACGATACTT 6060 

SO 

GTTCCATCAG TTTCTCTGTC TGTGAATACA AAGAAGTCAT GACCTAATAG ATTCATTTGT 612 0 

55 



1057 



EP 0 786 519 A2 

ATCTCOTTAT CATCGTAAGC OTCATTATCA ACTTGTOTTT CTTOCATTTC TTGTAATTCO 6240 

GCAACAAACA CTTC TT GATC TCCTCGATCA CGOCTCTTAC GATTAATACG TGTTTTATAT 6300 

5 TTTCGAACTT GTCTTTCAAG TTTATTATTA ATTAAATcAA TACCTGCGTA TAAATCATCG 6360 

TTTCGCTCTT CAGCTCTTAA CGTAACATTT TTCAATGGAA TTGTTACTTC AATTTTAGTA 6420 

GCTGAATTTG AATAAGTTTT AACTTTAACA TGCGCCACTG CATTTGGTAC GTCATTAAAA 6480 

10 

TAACGTTCCA ACTTACCAAT TTTTTCCkCA ATATAGTTGC GAATAGCATC TGTGATAGTG 6540 

AGGTTATCTC CATGAATTTC AAATCTAATC ATAGTAAATC TCTCCTTAAA CCTCTTTATn 6600 

GGnAACTCnT TATTATATTT AACATTTTTA CGCCAATCGT GCAAA 6645 

15 

(2) INFORMATION FOR SEQ ID NO: 260: i 

(1) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7430 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 260: 



35 



40 



45 



SO 



CAGTTCCAGC 


ACAtCTATTG 


GGGATCAACA 


AACTAGGGAA 


AATG CTAATT 


ATCAACGTGA 


60 


AAACGGTGTT 


GACGAACAGC 


AACATACTGA 


AAATTTAACT 


AAGAACTTGC 


ATAATGATAA 


120 


AACAATATCA 


GAAGAAAATC 


ATCGTAAAAC 


AGATGATTTG 


AATAAAGATC 


AACTAAAGGA 


180 


TGATAAAAAA 


TCATCGCTTA 


ATAATAAAAA 


TATTCAACGT 


GATACAACAA 


AAAATAACAA 


240 


TGCTAATCCT 


AGCGATGTAA 


ATCAAGGGTT 


AGAACAGGCT 


ATTAATGATG 


GTAAACAAAG 


300 


TAAAGTGGCG 


TCACAGCAAC 


AGTCAAAAGA 


GGCAGATAAT 


AGTCAAGATT 


CAAACGCTAA 


360 


TAAC&ATCTA 


CCTTCACAAA 


GTCGAATAAA 


GGAAGCACCA 


TCATTAAATA AGTTAGATCA 


420 


AACAAGTCAA 


CGAGAAATTG 


TTAATGAGAC 


AGAAATAGAG 


AAAGTACAAC 


CACAACAAAA 


480 


TAATCAAGCG 


AATGATAAAA 


TTACTAACTA 


CAATTTTAAC 


AATGAACAAG 


AAGTGAAaCC 


540 


TCAAAAAGAC 


GAAAAAACAC 


TATCAGTTTC 


AGATTTAAAA 


AACAATCAAA 


AATCACCAGT 


600 


AGAACCAACA 


AAGGACAATG 


ACAAGAAAAA 


TGGATTAAAT 


TTATTAAAAA 


GTAGTGCAGT 


660 


AGCAACGTTA 


CCAAACAAAG 


GGACAAAGGA 


ACTTACTGCA 


AAAGCGAAAG 


ATGATCAAAC 


720 


GAATAAAGTT 


GCCAAACAAG 


GGCAGTATAA 


AAATCAGGAT 


CCTATCGTTT 


TAGTGCATGG 


780 


TTTCAATGGG 


TTTACAGATG 


ATATTAATCC 


TTCAGTGTTA 


GCTCATTATT 


GGGGCGGTAA 


840 


TAAAATGAAC 


ATTCGCCAAG 


ATTTAGAAGA 


AAATGGTTAC 


AAAGCTTATG 


AAGCAAGTAT 


900 
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TCGTGTAGAT TATGGTGCAG CACATGCAGC AAAATATGOA CATGAACGTT ATGGAAAAAC 1020 

ATACGAaGGA ATTTACAAAO ACTGGAAACC AGGACAGAAG GTACACCTAG TTGGACATAG 1080 

5 TATGGGCGGT CAAACGATAC GTCAACTAGA AGAATTACTG CGTAATGGTA ATCGTGAAGA 1140 

AATAGAGTAT CAAAAGAAAC ATGGTGGcGA AATTTCTCCA CTATTCAAAG GTAATCATGA 1200 

CAATATGATT TCATCAATTA CTACTTTAGG AACACCACAT AATGGTACAC ACGCATCAGA 1260 

10 

TTTAGCTGGT AATGAAGCTT TAGTGAGACA AATCGTATTT GATATCGGTA AAATGTTTGG 1320 

TAATAAAAAT TCAAGAGTAG ACTTCGGGTT GGCTCAATGG GGTCTAAAAC AGAAGCCAAA 1380 

TGAATCATAT ATTGATTATG TGAAAOGCGT TAAACAATCT AATTTATGGA AATCAAAAGA 1440 

IS 

TAATGGATTT TACGATCTGA CGCGTGAGGG TGCAnCAGAT TTAAATCGTA AAACGTCGTT 1500 

GAACCCTAAC ATTGTGTATA AAACATACAC TGGTGAAGCA ACGCACAAAG CATTAAATAG 1560 

CGATAGACAA AAAGCAGACT TAAATATGTT TTTCCCATTT GTGATTACTG GTAACTTAAT 1620 

20 

CGGTAAAGCT ACTGAAAAAG AATGGCGAGA AAACGATGGT TTAGTATCCG TTATTTCTTC 1680 

TCAACATCCA TTTAATCAAG CTTATACAAA AGCGACAGAT AAAATTCAAA AAGGCATTTG 1740 

2S GCAAGTGACG CCTACAAAAC ATGATTGGGA TCATGTTGAC TTTGTAGGAC AAGACAGTTC 1800 

TGATACAGTG CGCACAAGAG AAGAATTACA AGATTTTTGG CAT CATTT AG CAGACGATTT 1860 

AGTGAAAACT GAAAAGCTGA CTGATACTAA GCAAGCATAA TTTATAAAGT AAAGGGAGGA 1920 

30 ATTAATAATG ACTGCAGACT TCTTTCAATT AATCGGATCA TTATTTAGAA TTCTAAAAGA 1980 

ATTATTCAAG TAAAACATTG GCGAGGCCCC AACATAAAGA ATTTCGAAAA GAAATTCTAC 2040 

AAACAATGCA AGTTGGCGGG GCCCCAACAA AG AAGCTGG C GGAAAGTCAG CTTACAATAA 2100 

35 TGTGCAAGTT GGCGGGGCCC CAACATAGAA GCTGGCGGAA AGTCAGGTTA CAATAATGTG 2160 

CAAGXTGGGG TGGGACGACG AAATAAATTT TGCGAAAATA TCATTTCTGT CCCACTCCCA 2220 

TTGGCATTTA OGAAGTTTAA ATGTGCAATT AGAATATATG TATAACAATA TTAAACACGC 2280 

40 GGTAAAACGA AGTCAGTCAA TTCAAACTGA TTTCGCCCAC CGCGTGTTTT TAACATAGCT 2340 

TAATAATTAA TAAGCATTAA TGTTCAATTT ATATGGTTGT TTTCCAATAA TAAACCTAAA 2400 

GATATAGAAT TCACG CAATA TCATGCCGAC ACCTATACAT AATCCTAAAA TGAATAGTAG 2460 

45 

TGATATCGCT AGAAAGACCA TTGTATTATC CTCAAATATA TTTGTATATG CAAACAATGA 2520 

GTCTAGAATG ATTGGATGTA ATAAATAAAT AAAGAATGAG AAAGCACTAA TCATTTGAAT 2580 

CGTATTAAAT AACATTGTTT TAAAATGCGT GCAAATACCC AAGATAACAA TAAACATAAT 2640 

60 

ACTATTATAT GGTGTTAATG AATATGAAAA GCTGGTAACG TTCCAATAGT CTCCaTTTGT 2700 

55 



1059 



TCTAAOAAAT TTAATACACO TTCGTAGTTA 

AAAATCCATC CGAATATTAT AGTATTTTCA 

6 TGAAACGCTG TOTTOTTOOT AAAGTAATAT 

AATAATAATA TTTTACTGTT GAATAGGTTA 

ATAAAGAATT GCATGATAAC AACGATAAAA 

10 

TCAATGAATT GTTTATTGAA ACTTGAATCT 

AATCCCATTA ATATGTAAGG AATAAGTATA 

GTGACTTTTT GGTAATTCAA GGTTGTCAGT 

1S 

CCAAAAATCA CAATATTACG AATGTAAAAT 
TCATGTTTTA AAGTAATTTG TGTAAGTAAA 
GCACGTAAAT ATACGAGTTC AAGTCTAATC 

20 

TAAATGCTCA AAAGCATCAT CACTAATTAA 
CGGAGTGACT GCTTTTTCCT CTAATGAAAA 

2S CGGTAATTTA TCGTCATTCA TCAAGCCATA 

AAAGTTTTTA GTTAGATATT TTTCACTTTT 
AGCTTTCATT AATTTTGACT TATTATTTTT 

30 TTCAAATTCC CATAACCCAG TTTTATACAT 

GAGGTTGTGA AAGTTTTCTT CCCCAACATG 
TTTATATTTT TTTAAGATTG GATAAGCATT 

35 GTTAATCCAT ACACTTCGTT TTGGaAACTT 

CAAQGTTAAA AATTTAGCAT CATGTGATTT 

TTGACTAACA CTATAATTTT TAATTTCTTT 

40 

CAGAAAATTC GCTTTTCTTA CACGGTGATA 

TTTCAGTTTT TTAGGTGAAT CGTCATCTGC 

TACAGGCAAT ATGATCAAGA TACTCAACAC 

45 

TCTCTTCCTC TCTGCCATTT TTGAATCAAT 
ATCGCGAAAA TGCCCATAGT TTCAAATATA 
GCAACACGTA TTGTATTGAT ACTTTCGTCA 

60 

AGTAGAACAA CTAAACAATA TATCCAAAAG 
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TAACCCATAT ATGCACCTAA GAAGAAATAA 2820 

CTTAATGGAT AATAGTGTAG CACGGTATCG 2880 

AAAAATGATT GCTGTAAAAT AAAAGATAAC 2940 

TAGTTAATTT TAAAAATGAT ATAACTCAAA 3000 

TAGCCATACC . ATTGACCTAA TAGGACATTT 3060 

GTTAATAATG ATTCACTATA ACTGTAAAAC 3120 

TATTTTAOGC GTGTAGTTAA GTATCTATAG 3180 

AACTGTGACA AGATAATAAA GCAAGGTCTA 3240 

TGTAACACTA AGGATCCACC CTCCATATTT 3300 

TGTGTGATAA TAATAATTGC ACATATAATA 3360 

TTTTTCATGG AATCCGTCCC ATCTCTTAAT 3420 

TATTCTAGGG ATGTAATAAT CATTGGAGTT 3480 

ACCGTATTTT AACCCAGCTT TTTTGATTAC 3540 

AGGATAGGCT ATAGTTTTCT GCGACTTTTT 3600 

GTTTAAATCT TTTATGATTG TAGCTTCAGA 3660 

AGATAAGTTA TGCAAATCGT GGGTATGTGT 3720 

TTCTTTTAGT TCTTTTTTAC TAATCATATC 3780 

ACCTGTGATA ATAAACCCAG TTGCCGGTAT 3840 

TTCATAAATA GTTTCATCCA TATCATCAAA 3 900 

ACCTTTTTTC TTG t AATAT A AAAATTCTTT 3960 

TAG C CATTTT ATTTGAGATT CAAATTGTGA 4020 

ACTACTAGAA AAGAAGTAAA TAAAATTATT 4080 

ATTTAATGCC AGAGCACTAT TTTCTTTATA 4140 

ATTTGCAATA TGATGACCAT CCAGTGTGCT 4200 

TAAAATTATA AATTTTCTAT ACTTCACGAT 4260 

ATGCTAATTG TAAAAAATAC AAAAATGATA 4320 

TCTAAAATTT CAGTATTTTC AATGTTTAAA 43 80 

TGAATTTCAA ATATAGTACC AATATAAACG 4440 

ACACAAGATA TAGCGATAAG TGCTGTTTCT 4500 
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w 



15 



20 



TTGCGTAACC ACCTTTCTTA CGTTTTAATG CTTTTGGAAA TGCGACAAGA ACTACTGCTG 4620 

CGTTAATAAT CCAGTATACT GTCGGATACC AACTTACAAA TATGAGTCCA GCCATATTCT 4680 

TTTTCTCGTA GCGACTATCA ATAAAGAGTG CGACTGTAAA TTGAATAACG TTTATAAAAG 4740 

TCATAGTAAA TGATGATAGT AGAAATATTG AAAAACTATA TGTCATAAAT GTATAGTCTA 4800 

AGAAGTTTGC TGTTATGAAC AAATAGCCTA AATATAGAAG CACTATATAT ACCCATAAAA 486 0 

TCGAGATGAT TTGCTCAAAC ATCAAAATAT ATAAAGGAAA CCTTTTCGTT TTCATTGTGC 4920 

TAAAAAAGTC TCGTAGTAAT ACTTCGTGTC CCCCTTGAGC CCATCTCACG CGTTGCTTCC 4980 

AAAGACCTCC CAATGTTTCT GGAACCAACA TCCAACACAT GGCAAGOGGT TCATACTTAA 5040 

TACGATATCC ACGTAAATGC AATTTCCAAG AAACTGCAAT ATCTTCGGTA ATCATATCAG 5100 

TATCCCAGTA GCCAACGTCG ACAACTGCAC TTTTTTTAAA TAGAGTGAAG AGACCOGAAA 5160 

TAGTATTGAC TGCGCCAGCA AGTGTCTGAC TtCGCTTAAT ACAGCCAATT AAACTTGCAT 5220 

ATTCTATCGT TTGAATTTTA CCTAAAATAG AACTCTTATT TCGAATTCTA GGATTACCTG 5280 

TAACTGCACC AAGTTTTGGA TCATGTTTGA AATTCTCAAT CATATAATAT GGTGCATCTT 534 0 

25 GATCAACGAT AGTATCTGCA TCCAAGCACA TTACATAATC ATATGAAGCC TGTTTAATGC 5400 

CTTGATTGAG TGCGTTGGCT TTACCTCTGT TTTCTTGTAA ATCGACGAAA ATAAAGTCAT 5460 

TATTTTCTTT GATTTTATAG ATGAGTTCTG CTGTATTATC TGAACTTCCA TCATTAATGA 5520 

30 TAATAATTTC TTTCTTCTCG TATTTGAGTG CAAGAACATT AGACAACGTA TCTTCAAyCG 5580 

TTTCACTTTC GTTATAACAG GCAAGTAAAA ATGTAATGCC TTCTAATTCA TCCACATTTA 5640 

TGTCAGGCTT CTTGTTCAAT GAATATCTAA TTTCTCTGGT AAAATAGAAA TAAATTGAAC 5700 

CGACAATCCA GTAAATAGAC ATAAATACAG GATAAAAAAG CAAAAAGTTA AAAAATTGCA 5760 

ATrtCTTTAC CTACCTTTCG TTAGTTAGGT TGTAAGCCAT ATGGTAATTG ATAGTATTTT 5820 

AATTTGCAAT AGATTGTTGT TATAATTAAA CGGAAATATT TGTAATTGCA ACTTAATTTT 5880 

CCTGTAACAT AGTGTGATTA ATTTTCAGTA GGGGGTTATA AAAATTGAAG GATAAGATTA 5940 

TTGATAACGC AATAACCTTA TTTTGAGAGA AGGGGTATGA CGGTACAACA CTTGATGATA 6000 

TAGCTAAAAG TGTAAATATA AAGAAAGCGA GTTTATATTA CCATTTTGAC TCGAAAAAAA 6060 

GTATTTACGA ACAAAGTGTT AAATGTTGTT TTGATTACCT TAATAATATT ATTATGATGA 6120 

ATCAAAATAA ATCGAACTAT TCAATTGATG CTTTATATCA ATTCTTATTT GAGTTTATTT 6180 

TCGACATCGA AGAAAGGTAT ATTAGAATGT ACGTTCAATT ATCTAATACG CCTGAGGAAT 6240 

TTTCTGGAAA TATTTACGGA CAAATACAAG ATTTAAATCA ATCATTAAGT AAAGAGATAG 6300 



35 



45 
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TGCTGTTTCT TGAAAGTTGG TATTTGAAAG CATCCTTTTC 
AAGAAAGTAA AAGTCAATTC AAAGATGAAG TGTATTCGCT 
5 AATAATTTTT GTTACTAGTT TGTAATAATT AACTTACTTT 

TATTTTTTTA AATCTATATA AAGTTGACAA TACAAATCGA 
ATATGAATTT TATAAATTAA ATGCAATACA TTAATATAAA 

10 

GATTTGTTCA ATGATTTGAT AATATTATTC TTTATATTTG 
TGAACATATT ATAAAAGTGT AATGTTCCCC TGAAAAGAAT 

15 GAAATCCGCA TAAATTAGAT GAAATGGAAA GTAATAAGTA 

TATGTGATGG TAAATCATGA CATAGGCGCT TTTTTTTATA 
ATTATATAAA TTACCCACAT CTTTTTAAAA GGTGTGGGCT 

20 CACAGTGACG GGTTACGCAA GGTATTGAAT TACCGAGTAC 

AGAGCAAATA ATCAAGTAAT GATGATGCTT CTACTCGATT 
TACGATGGTA TCTAGTTTTA TTATTAATAG GTTTGGATAT 

25 

ATCTTGTGCA AAAATATAAA TAAGTTATAC ATAATGGTAG 
AACGATAAAA TATTTATATA AATAATTAGA GaAAATGTAG 
TTAAACTAGA TATAATTGTC CGATTTATAA AACATACATA 

30 

TGTGGAGGAA ACCATGAmAG AmAAGTTTgA TTTAGTAAAA 

GAATATTAAA TTATTGCTTA TTTTACCGGC AATATGTCTT 

3S (2) INFORMATION FOR SEQ ID NO: 261: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4082 base pairs 
r (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
40 ' (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 261: 

45 



60 



ATTGTTACTC 


ATTATTTTTT 


CATATTCACA 


CAAATGATCT 


TGTTTATATT 


TAGCTAATTG 


60 


ATTTTTATCT 


AGCATTTTAT 


CCTCCTGCTG 


AGTTTGTAAC 


CTTTAATAAT 


TTATTTTCTA 


120 


TAAAAACTTA 


GTATTCCAGT 


TGCTTATTAT 


ATCATTGATG 


AAAGGCTGAA 


ATAAAACATA 


180 


AACTGTTCCG 


ACCATTAACG 


CTGTAGCTAA 


AGATAAGTCT 


ACAAGTCCAC 


CTGTTTTAAA 


240 


TTGAATCGGT 


GTCTTCACAT 


TAAACGGTAA gGAknAAAAT 


AATTTCACGC 


CTTTTGGTGT 


300 
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GCAAAAATTT GGAGCAGTGG 6420 

ACTAAATATA TTTTTGAAGA 6480 

TGTAAAAAAA GACATGAGAT 6540 

TATTGAGAAT ATTAAGATGT 6600 

TATCAATTGT TGCAAAATAC 6660 

TGAATGGTTA AGTTTGTCTT 6720 

AAGTTGTCAT CTAATTACAG 6780 

ATAATTTATT GATAAGCGCC 6840 

AGTTAAAAAT GTAAATAAAA 6900 

TTATTATCAT TAACCCAACT 6960 

GGGCACGCTC GGTGTTGTAA 7020 

ATAAGAAAGC CATGATAGAG 7080 

TTAAAGTTGG ACAATATTAT 7140 

AGAATCATGA TATAATTTTA 7200 

TTGTGTATGT yTTGTGGtCG 7260 

ATGAATACaA TGATTGATTA 7320 

CTATTAAATA TTCTAAAGAA 7380 

GTAGTAAGTG 7430 
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AGGCGTCTGA ATAATTTGCA ATAAAAATGC 
AAAGGTTCGA TGTCCAAAGA TCAATCTCAC 
5 AATCTTACTT TGAGTGTGAC ATATATCGGG 

AACCGTAACC GACGAAAAAA TATCCGTTTG 
CATGCCGCAT GAAGCATGTG TTTTACCTGT 

10 

TACCACATCC CTAACAAAAA CACGAACATA 
AATTTAAAAA AGTATCACAT AACTCTTGAA 

1S ACAAAATATT TAAAGGATGT GTTTGAATAA 

AAGTGCGTAT TCAATGGAGA GTTGCTGATA 
TTACACAAGA CCAAGATATT CATGCAGTTC 

20 TCGGCTCAAC GTTTGGTAAA ACGAATCGCG 

TTATTTATAC TCAAAATGAT CAAAAGGTTT 
AaAATCATTC ATGGTGAGGG CTTCATGAAT 

25 AAACAAATAC AAAAGGACAA CTGTTCCCAT 

TTTATAACAA AAGATGTGCC ATCAAAGAAA 
AGAAAATCAT AAACAATTTG CCGATGCTTA 

30 

CTACTTCAGA CAAGTATATT AACTGCGATA 
TATCATTTTG TACACCTTCA ATTAATATAG 

35 TAATCGTTTG AGAAGCCTGT GCCGCTTCAG 

AAGGTTTACC CAATATGACA AAAAAGGGCG 
CAATACTCAT TACTACAGGC AAAATAACAA 

40 ACTTAAAAAA GTCAATAACG CCCGGTGCTT 

CATGTCTCAA TGCCGTCTTT CCTTCTGGCA 
CCTTAGCATA CTCATCAGGA ATTTTATTTA 

45 

CAACGAGGCA GGATACTATC ACTGATAAAT 
CTGTTTCAGC AACTACAATT GCAAAGGTGA 
CTGTTGCCTC ACGACGAGAA TAATATCCTT 

50 

CAACAGTTCC GTCTCCAATA AATGATGCTA 
TAAATAAAGG TCTCATAACC GGTCTAAAAA 

ss 



IHlunl Iowvj 






420 


AAnAnnALiA 


All ACV- 1 1 nA 


ALV 1 iv 1 ViCC 


480 






f^P H a H TV'S H *T» 


S40 


AAAA1A1 l\y 1 


GTTGTTAGCG 




600 


CATATTTGTT 


CTCCTTTAAT 


ACTCAGATTT 


€60 


TTTTCGGGTT 


AAAATTCATT 


AGTATGACAC 


720 


AACGATTACA 


AAATCGTTTA 


TGATGTATTT 


780 


TGGGAATGAC 


AGTAAAAAAG 


GATAATAATG 


840 


TCAAAATTCC 


TACAAGTGAA 


ATTAAAAATA 


900 


CTAAATTAGA 


CAGCAAAGAT 


GTATCTAGAA 


960 


TTATTATCGA 


TACTGAAGAC 


CACGAATACA 


1020 


ACAATGAATT 


AACTAAATAA 


ATTGTATAAA 


1080 


OA1V1TTTTA 


ATTGATTCAA 


CACCCAGCAT 


1140 


AATTTTAACA 


GTTGTCCTTT 


TTCACATATA 


1200 


TAATTGGTAG 


TGTAATGATT 


GTTCTAATCA 


1260 


CAGGAATCTT 


CGAACCAAGT 


ATGACGCCAC 


1320 


T ACT AAGTG C 


CCCAATAACA 


AAACGAGTTA 


1380 


AAGGTAAAAA 


CATATCGGCA 


AAACCGATAA 


1440 


GTATTTGCAT 


TAACTCTAAA 


AATGGAACAA 


1500 


TGTAGTTCGC 


AATAATGGTA 


GCAATAGTAC 


1560 


ACCACATATC 


AATGAcTlJTT 


TTTAATCCTG 


1620 


TAATACCTAC 


TTCTGTTGCA 


GTATCAAAGC 


1680 


ATGCCTCAGT 


ACGCGCACTT 


TCAGGTACCT 


1740 


AAGGCCAAAT 


TCTTGGCATA 


ATGACTGCTG 


1800 


AGAAAGCAAA 


AAATTGATTT 


TGCATGTGCA 


1860 


TAGAAACTAC 


ACTAAATGTC 


GTTGAAATAA 


1920 


CACCATATTG 


TCTACTTGTA 


ATTAAGACAC 


1980 


AATTATCTAC 


CGTCGAACGT 


CCTGGCAATG 


2040 


TAGGACCCAA 


CATCTCTAAC 


AAACCGTATT 


2100 



1063 



10 



15 



20 
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AACTTGAGAA CAATAATCCA CCCGTTTCAT CTGAGTAAAT AACCTTTGAA CCAATTOOTA 2220 

AAAATGTCAT CCATGCAAAA ACAACTGCTA ATATTCGTAA AATTAACCAA CCAATTCTAA 2280 

CGTTAAAAGC ATTGTTCATT AGCCCGTCAG GTTTCAATTT ATCTTTTAAA ATAGTTGAAC 2340 

AAATCAOAGT TATGATACCC GATAAAGTAA TTATCGTCAC AATTAAAAAT GGCATTACOC 2400 

CACCTAATAC ATCTTTAAGC ACGCCTGCTA AAAATGCCAC GGGCAACGTT GTTTGCTTCT 2460 

GTCCATCTTG TTCGACTGGA ATTGGTACTA AAAATAATAA GATACCAATT AAAGACATCG 2520 

TAATAAACTT AAGTCTCCCA ATAACTATCT CTTTCCTTGA AAAGCTATCC ATAAAATCAA 2580 

TCCATTTCTC TATGTATTCG TTTTAAGTAT ATACAGAATT CTATTCAGTT AACAAACATA 264 0 

TTCCTTATCA TTCTATCTTT CAAAATGTTT ATGTATGCAA AATAATGAAT AATTACAGTT 2700 

ATTAAATATA CGCTATTTCT TGTAATTTTT CAAGATGAAT TCAAAAAAGG TTAAGTACAA 2760 

TTACTGATTT CGTACTTAAC CTTTTTTAAA CTCTAATCAT ATGTTAGTTA TTTCATTCTT 2820 

CGTAATAATA TTAAGAAGTA TGGTGCACCG ATAATTGCAA TGATAACCCC AACAGGAATA 2880 

TCCAGTGGCG GATGAATGCC ACGGGCTAAA CCATCTCCAA ATGTTAACAA TATAGCACCA 2940 

26 ATTAACCCCG ACATGATAAT AACGTGTAAT GTTTTATTTC CTATTAATTG TCTCGCAATA 3000 

TGAGGTGGAA TTAATCCTAA AAAGCTAATA CCACCGACAA CTGAAATTGC GGATCCTGCT 3060 

AATATTACTG CTAAAATTAA CAATAGCATT TTAATAGTTT TAACTTTTAA ACCGAGTGCG 3120 

GTTGCAACAG CAT CAC CT AG ATTCAATACA TCTAATTGAT AACTCAATAA AATGATGATT 3180 

GGTATGGTTA TTAAAAACCA AGGTAATATA GTATAAATAT TCGACATATC ATGTCCATAT 324 0 

AGACTACCTG TCAACCAAAC AAGCGCTTTG TTTGCTTCCA GTGGATTTCT GATTAATAAG 3300 

AACTGCACAA TCGCCGTACA TATTGCGCCT ATTGCTAAAC CAATTAAGGC AAGCTTTGAA 3360 

CCTlSAACAT CATATTTTGA AATTAAAAAT GATAAAAATA AACTT ACT GC AAAGGCACCT 3420 

40 AAGAATGAAC CTATAGGTAA TACAAACAAT GGTGCTGTTG GAAAGGTCAT AATAATAATC 34 BO 

ACAGCAGCTA AACTGGCACC TTTAGAAATA CCTATAACAT CAGGTGAGGC TAACGGGTTT 3540 

CTTATTACAG CTTGTATAAT TGCACCTGAA ATAGCCAAGC TACTACCGAT AATAATACCA 3600 

45 AGTAATGTTC TAGGTATACG ATACTCATTT AAAATAAAAT CATCTTGTGT AAAGATTCCC 3660 

TTAATAGCAT CAATCGGATG AATCATGACA GACCCTACAC ATAAACTTAT GAATATACTC 3720 

ACAATTAAAA GGATTGTGAT TAAACTATAA CGACGTATAA TTTTCGTTGT CATCATATTC 3780 

60 

TTTTCACCCC TTTAATCGTT ATAAATAAGA AGTAAAGTGC ACCTACGAAT GATGTAACAA 3840 

TCCCTACTGG TGATTCATAA GGATATGTAA TTAAACGACT TAATACATCT GATAGTAGTA 3 900 
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AGCGTTTGAC TATATGOGGT ACGATTAAGC CAACAAATCC AATTOGTCCT GCCACTGACA 4020 
CCGACATACC TCTAAGAATA ATGACTAATA GTCCAATGAT AATTCTAACT TTATTTATAT 4080 
TT 4082 



(2) INFORMATION FOR SEQ ID NO: 262: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1145 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 262: 



20 



25 



30 



35 



40 



45 
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TATTAGAAGG 


TCGTTOGGAT 


GAACAATTAA 


AAAATTTAGT 


TAGCGAAGTA 


ACTGACGCCG 


60 


TAGAAAAAAC 


AACGGGGGCA AATAGACAAG 


CAATTCACGT 


TGTTATAGAA 


GAAATGAAAC 


120 


CAAACCATTA 


TGGTGTGGCT 


GGCGTAAGAA 


AGTCAGATCA 


ATAATTCTTC 


ATAAGATGCA 


180 


TGCCAATTAA 


TTCTTTGAAA 


ACGAACAAGG 


CGACTTCTAT 


CTGaGTATGA 


TAGAAATCGC 


240 


CTTGTTTATT 


TTTAATCTTC 


ATCTAAAAAG 


TCTTTAATAG 


CTTGTTTATT 


TGTGTTTTTA 


300 


TTAATCTGTA 


ATGCACTACC 


ATCAGTATTT 


GTATTGACAT 


CyTCGTATGA 


GTTCTTGATT 


360 


GGCaCAGTCA 


ATGACTTAAC 


ATCTTTTTCA 


CCTCGGATAC 


CaAAACTCAA 


ACCTGTTTGG 


420 


AAAATCCCTG 


AATCAGGAAT 


GTTTGTATTC 


ACATAGCCTC 


TTAAAATACC 


TGCAACTTTT 


480 


GGTAATTTAA 


CAACTGTTCT 


AAAATTAACC 


ATTTCTTTTT 


TCAATGTTTG 


CATCACTTGT 


540 


TGCTGACGTC 


GCACGCGTCC 


GAAGTCACCT 


TCAGGGTCGT 


GACGGAATCT 


TGCATAACCA 


600 


AGTAATTCTT 


TACCATTCAA 


CCTATGGTTA 


CCCTTTTTCA 


AAGATACACC 


AATATTTTTC 


660 


GACATATCTT 


TTTCGACATT 


AATTGGTACA 


CCTTCAGGCA 


TTAATTCATC 


AATCATTTTC 


720 


TCAAATCCAG 


TAAAATCAAC 


TACTGCATAA 


TATTCAGGAT 


TAATTCCTAA 


ATTTTTATCA 


780 


AGTGTTTTTC 


TAAGTAGCTC 


TGGACCACCT 


AAAGCGTATG 


CTGAATTAAT 


TTTGTGTTTT 


840 


CCATATCCTG 


GAATATCTGC 


ATAAATATCA 


CGCATGACAG 


ACATCATTTT 


CATCTTTTTA 


900 


TTGATAAAGT 


CATATTGAAC 


AACCATGATA 


GAATCTGTTC 


TTGATTGTCC 


ACCTTGTGCT 


960 


TTATCTGCAC 


CGAGTACAAG 


AATAGAAATT 


nTACCATCAT 


TTTTTACTGG 


TCCATTAAAT 


1020 


TGATGTACTT 


TAACATCTTT 


CGCATGTTTC 


TTGGCATATT 


CTACACCGCT 


ATTGTAACTA 


1080 


TGTACAATAT 


ATACAACTAA 


TGCCGATAAG 


TAAAATTACA 


ACAATCAGAA 


GAATGATAGG 


1140 


TAATT 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7075 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 263: 



1$ 
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TATGGCTCAT 


CATTAATGCA 


CGTATCGGGT 


AGCGTTTACC 


ATTGATAAGT 


GCTTCATGTT 


60 


TAGCACGAGT 


TCTTAAAATT 


CCATCGCCAT 


AACCGATATC 


AACTACAGCT 


AATTTTGTAT 


120 


TOTTTTTAGT 


CACTTCAAAG 


GCAAAGCTAT 


AACCGCAATA 


ATCACCAGCT 


TGTACTTCGC 


180 


GCACTTGAAT 


AACATGTGCT 


TTTAAAGTTA 


ATGACTGAAC 


TATATCATGT 


TGATTCAGTG 


240 


AACTATATGG 


TCTTGAACCG 


TATAACGCAA 


TACCTACACG 


CGCATGTGTA 


TGGTGGGGTA 


300 


GTAATAyyyg 


TCCTTCCCGA 


TAAAAACTCG 


CACTATTTTG 


AGCATGGATT 


AGGTCGAACT 


360 


GATAACCTTC 


AGATAAAAGT 


GCTTCAACAA 


TTTCCATCCA 


TTGTGAACGT 


TCAACATTAT 


420 


AAtCTGACAC 


ATCGAATTCA 


TCAGCATATC 


CAAAATGGGk 


CCATAAACCA 


CTAATAATCA 


480 


TTTTTGCATT 


TTGATTATGA 


TGGTGATCTT 


TCAATACTTC 


TTTAATTTCG 


TTTAAATCTT 


540 


TAAATCCAGA 


CCGATGTAAT 


AAATTTTCAA 


ATTCTAAGTG 


AACATGAATA 


CCAGCTAAAT 


600 


CATTTTTATG 


GTTATAGTAA 


TATGTCAACG 


ACGGCAAAGT 


CATGTGTATT 


TGATGTTCAC 


660 


GGACTAAATC 


AAACTCGTAA 


ACTGCATTCA 


TTAAAAAGAT 


TGTTGCATCT 


GGAGCAAGTT 


720 


GTCTAATTTG 


AATTGCTTCT 


CGTAGTGATG 


TTGTGCTAAA 


TGTATCTATA 


CCTGCATGGA 


780 


TAAACTGAGT 


TACAGCAAAT 


TCTAGGTCAT 


AGTGATATGC 


ATTaTTTTTA 


ACAACTGCCA 


840 


TTAATGGCTG 


ATTGTTTTTG 


ACTGTGATTG 


CATTTTGTAA 


AAATATTTTC 


TTATTTACAG 


900 


ACC^TGTTGC 


TGTCAATGTA 


TTACACCTCT 


TTGTAATTAT 


TTAATAAATT 


TTCGTAAAAA 


960 


TTAACCACGT 


TTATTAACAC 


TTTTTCATCA 


AAATTTAAAT 


GTGATGTGTG 


CAAACCAGTT 


1020 


ACAAAACCTT 


TATCTTCATT 


TCGTGTTCCT 


ATAAAAACAA 


AGTAAGCTGG 


AGCTAGTTGT 


1080 


TGACCATAAA 


AACTAAAATC 


TTCCCCAAAT 


AAGAATGGCG 


TTGGTTTGTC 


ATAGACATTT 


1140 


AAATCAGCTT 


TTATTAAGGC 


GTCCTCTATT 


TGAGTACGTA 


ATTTCGGACT 


ATTGATTGTA 


1200 


GGGGGATAAC 


CTTCTGCAAA 


TTTAACTTCA 


CAATCTACAT 


TAAACAGAAG 


CTTGACACTT 


1260 


TCTGCTATCT 


TGTGCATTTG 


ATTTTTAACG 


ATTGTTAAAT 


CATCAATATC 


ATATGTACGA 


1320 


ATAGTACCTT 


CTAAATAGCC 


ATTACTTGGT 


ACAGTGTTAA 


TCGCTTCACC 


AGCTTTAAAA 


1380 


TGACCAATAT 


GAACAATATT 


TCGTTTCAAA 


CCGTTAAGGT 


GAAATTGTTG 


AATTTGTGAT 


1440 
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10 



20 



25 



ACATGACTTG ACAGGCCTGT TAAGAAAAAG CGATACTCTG TTOCGCTOGC CGTAATTTCT 1560 

TCATCTCTTA TCACTGCAAT GCCTTCATCA GCAAATGGGT TAACATGAAT ACCAAATACC 1620 

GCTTCAATTG GATACTTATC AAAGGCACCG GCTTTTATTA ATCGATTTGC ACCGCCACCA .1680 

GTTTCTTCTG CAGGTTGGAA AATGAAAACG ACATTTTGCG GTAATTGACC TGCATCTTGC 1740 

ATGTCTTTGC AACGTTGTAC AAAAAGCATT AATGCAGTTG TATGACCATC ATGTCCACAA 1800 

GCATGCATCA CATGATCAGA TTGACTGCGA TAAGGCACAT CATTTTCCTC TAAAATAGGT 1860 

AACGCATCAA TATCAGCTCT ATACGCTATC GTATGTGAGC CATTACCTTC TAAGTATGCA 1920 

IS ATGACGCCAG TTTCCAATGG GCAATCGTAT TTAATATTTA AACTATCTAA AAACGCTTTA 1980 

ATATAAGCAG TTGTTTCAAA TTCATGTAAG CTTAATTCAG GATGTTGATG TAAATGACGG 2040 

CGATGTTTCG TAACAAATTC TAATTCATTC ATAATTATCA ATCCTTTGTG TTAAATTACT 2100 

ATATAAATAG TGTAACGtAT TTCGAAATTT GTGATCATAA GTTTATTCAA TGCTAAACAA 2160 

TAAGGTTGAG ACATAATCGT ATCTCAACCT TGAAATTATT ATACGTTGAC GTCACTAGTC 2220 

ATTCAGTTTT CTTAATGCTG CTACAATCTC TTTTTTAGTA TCTTGTACTT CAGAAGCTTG 2280 

CTTAATCACT TTTGCAGGTG TACCAGCAAC AACTGCACCA GCTGGTACAT CTTGTGTCAC 2340 

AATCGCGCCA GCTGcAACAA TAGCACCTTT ACCAACACGT ACACCTTCTA AAATAACTGC 2400 

ATTTGCACCG ATTAATACAT CATCCTCGAT TATAACCGGT GAAGCACTAG GGGGTTCAAT 2460 

30 

CACACCTGCT AATACTGCGC CAGCCCcTAC ATGTACATTT TTACCAGTTG TAG CACGACC 2520 

ACCGAGAGTA GCATTCATAT CAATCATTGT ACCTTCGCCA ACX3ACTGCGC CAATATTAAT 2580 

35 TGTTGCGCCC ATCATAACGA CAGCACCATC TTCAATAATG GCTTGTTCTC TAATAAACGC 2640 

ACCTGGTTCA ATTCGTGCAT TCGTATTTGT TAAGTCTTTT AATGGAATAG CAGAATTGCG 2700 

ACGATCCATT TCAATTTCTA TATCTTCGAA TTGACTACCA TATGCTTCGT AAAAAGGTTT 2760 

40 CCAATCATCC GCTTGACAAA AGATTACTTT AGATTGTTCT GAACCAAATA CTTTAAAACT 2820 

TTCTGGATAT GTGATGCCTT CAAAATTACC ATTTAAATAT ACTTTTATTG GTGTAGACTT 2880 

TTTAGCATCA CTTATATATT GAATAATTTC TTCAGCTGTT AAATGTTGTA CCATAAAATA 2940 

ATCGATCTCC TTTAATATGT TTATAAGTTG TCAAACGTAT AAAAGCCGTT TGGTTTATTA 3000 

ACTAAGCGTT CTGCTGCTTG TATTGCACCA TTCGCAAAAA TATCTTTTGA TTGTGCACGA 3060 

TGCGTGATTT GAATCGTTTC ATCAGTGCCA GCAAATAGAA CTTCATGTTC ACCGACAATC 3120 

GTACCTCCAC GAATAGAATG TATACCAATA TCTTGTGGCT GGCGTTTTTC ATTTAATTCA 3180 

TGTCTATCAT ACACAGGTGT TACATTTTCT TT CAAAG AT A CGATCACATC ATACAATTTT 3240 
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15 



TCGAAATCAT CAAGTAOGGG AACAGCAGCT GCTAAAATTT TAGTCAATGC ATGAACGCCA 3360 

TAACTCATGT TCGCGCTGAA AAACACAGGC ATATTTTGAC TCAATTCATC TAACTTATTA 3420 

AGTAGTTTTT CTTTCTCGnC CAGTgTTGCC ACAACTAATG GCAAATGAAA ATCTTCATCT 34 80 

AATAAAGGGA AAAGCAGATT TGGATTTGAA AAATCTATTG CAACATCGGC ACCTTTAACA 3540 

TCTGCAATAT GTTGATATTG TTGATATGGC GTTGTTGCTT TCGGTGTATT TTCAATOACC 3600 

CCAACGATTT CATGTCCTTT TTCTTCTGCT AATCTAGCAA CGCGTTGATT CATTGCGCCA 3660 

TAGCCAATTA GTAATATTTT CACTCATTTT CACCCGCTTT AAATGTGTCA TATGTTTCAC 3720 

GAAGCACTTT AGTATCTGTA TCTTCTAGGC TAACCAATGG TAGACGTAAT TCATAATTTC 3780 

CAAATCCTAA ATAACTTGTT AGAGCTTTAA TAGGAATTGG GTTAATATCA ACTGATAAAG 3 840 

CTGATAACAG TGTGCCGATT GGTTTAAATT GATCTTGAAT ATCTAATCCA CTTTGTTGAG 3900 

20 CATCGTATAA CGCTTGAAAT TCTTTAGGAA TGACATTGGC AATAACAGAG ATAACCCCTT 3960 

GACCGCCACG TTGATAGTAT TCGACGACGT TGTCATCATT GCCACTATAT AATGCAAATG 4020 

AATTTGTATC AATGCGCTTT TTCACTTCTT CTAAATACTC AAAATCATTC GTAGCATCTT 4080 

TTAAAGCAAC TATATAAGGA TGTTGACTTA ATATTTCTAC AGTTTCTGGT TCAATTGTCA 414 0 

TGTTCGTTCT TGAAGGAACA TTGTACAGCA CGACTGGTAA TTTCACAGCA TCTGCAATCG 42 00 

CTTCAAAGTG TTTGACTAAA CCACGTTGGT TCGTTTTGTT GTAGTAGGGC GTAATTAACA 4260 

TAATTGCATC AGCCCCTAAG GCTTTAGCTT GGATTGAAGC TTGGATTGAC TTTTCAGTAT 4320 

CATTAGTGCC AGTTCCTGCT ATGACAGGAA CACGTTTATC TACAAGATCA ATAACTGTTT 43 80 

TTAGAATGCG TTCTTTTTCA TCTGTTGTTA AAGTAGGGCT CTCAGCAGTA GTTCCATTAA 444 0 

CGATGATTGC TTGGGCATTA TTTTCTAGTA AAAAATTAAC GTGTGTTTTC AAAGCTTCAA 4500 

TATTAACTTT GTTATTTGTA AAAGGGGTTG TAAGTGCaAC SCCAACACCC TCAAATAAAT 4560 

40 GTGTCATTTT AATTCGCTCC TTTTAAACGC ATAACTTGTT CCAATACTTG TACAGCATTT 4620 

AATGCAGCAC CTTTTAATAA ATTGTCTGAT GTACACCATA CATGGAAAGT ATTTTCTAAT 4680 

GAATCATCTC TACGTATACG GCCAACAAAC ACTTCATCTT TATTAGTAGA ATTGATTGCC 4740 

45 

ATTGGATATT CATTGTTCTC TGGATTGTCT ACTAAAACAA CGCGGTCATC TTGATCAAAT 4800 

AACGCTTTAA TATCTTCTGC TGTTGTTTCT TTGTCAAGCG TTACATCAAT TTCAACACTA 4860 

TGACTATCTT GAACAGGCAC ACGTGCGCAT GTTGCTGTTA CTTTTAAGTC TGGCGCATTT 4920 

SO 

AAAATTTTTC TCGTCTCATC AATCATTTTT TGTTCTTCTT TTGTATATCC GTTTTCTAAA 4980 

AACACATCAA TATGCGGTAA CACATTATTA TAAATTGGAT GTGGATATGC TTCTGGTGCT 5040 
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TGATATGTTG TATATGCCAC TCGTTTTAAA CCATAAGCAT CTTGCAATAC TTTTAGAGGT 5160 

ACAACAGATT GAATCGTAGA GCAGTTTGGA TTGGCAATGA TACCTCTTCT AAATGTAGGT 5220 

TCATTGACTT CCGGAACGAT TAAATCAATA TCTTCTGCCA TACGCCATTG ACTTGAATTG 5280 

TCTATAACGA TTGCACCAGC TTTTTCAAAA AGTGGGGCAA AGTGTTCGCT TGTACCGCCA 5340 

CCAGCACTCA TTAATACATA ATCGAAATGT TCACTTGCAC GAGCATCAGT TAATTCTTGA 5400 

10 

ACTGTATATG TTTTTCCTTG AAATTCAACT TCTTGCCCTG CAGAACGTGC TGATGAAAAT 5460 

AATACTAATT CATCGAAAGG AATATTTTTA CGATTTAATG TCTCCAACAT TTTTGTACCT 5520 

15 ACTAATCCTG TTGCACCCAC AACTGCTAAC TTTGTCATAA CTTGTCACTC CATTTTATAA 5580 

TAATTTCCaA TTTTTAGAAT ATTTTAACAA TCATTTTACC ATTAAATGTT AAATGCGTCA 5640 

TATAGTTTTT CTACCGCTTG TTGCCCATTA AAATCATCAA TGACGTATGA AATACTTATT 5700 

20 TCAGATGTTG TTGTTTGGTA GAAAGGTATA TTATTTTCAA TTAATGTCAA AAATGCTTTT 5760 

GATGCCACAC CTGACATATC ACGCATGCCT GAGCCAATTA ATGAAATTTT GACATAATGC S820 

TCATTGATTT TATAAGCTAA TGCTTCATAT TGATTCTTTA ATGTTTCAAG AATCATAGAA 5880 

2S 

ATTTGATGAA AATCACTATC TTTAATCGTG AAGGATAGTT GTAGCCCATC CAAGTTGACG 5940 

ATTTGTGAAA TCATATCAAC ATTTACAGCA CCTTCTTCAA GTTCCGTAAA TAGTTGGGTA 6000 

AGTAGCTGAT TGTCAGGTAG GGGATAACTA ATTGTTACAT GCATCATATG TTTATCCAAA 6060 

30 

GCCACACCAG TAACTGCTTT TTTCTCTAAT ATTTCTTCAT TTGACATAAT CCATGTTCCT 6120 

TTCACGTTCG ATAAAGTTTT TCCTAAATAT AAAGGGATAT TATAGTTTTT AGCTAATTCA 6180 

35 ACACTTCTTG TTTCAAGTAC ACCAGCACCT AAAGCGCTCA TTTCCATCAT TTCTT CATAT 6240 

GAGACGATGT CTAGTCGTTT AGCCTTTGGT AAAAGTCTTG GGTCAGTGGC ATACACACCA 6300 

TCAACGTCGG TATAAATTTC ACAAGGTATT TGATTACTAA CAGCAAGTGC CACAGCGGTC 6360 

40 GTATCAGAAC CACCTCTGCC TAAAGTTGTT AATTCCTGAT GTTCATTGAT GCCTTGAAAT 6420 

CCAGCAACTA CTAAAATATC GTTTTCTTGA AAGGCTTGTT CAAATGTTTG AGGATTAATT 6480 

TGAGCAATTT TACTTTTTAA ATGATGGCCA ATGGTTTTAA TACCCGCTTG ATAGCCAGTC 6540 

45 

ATTGCTTTGG CATTCATACC GATATCATTT AATACCATTG ATAAATAAGA TACAGTTTGT 6600 

TGCTCTCCGG TTGTCAATAA TAATGCC7VGT TCTTGTTGTT TTGGTGCTTT AGTCAAGGTT 6660 

GATACATTCG TCATTAATTG ATCTGTTGTG TTACCCATAG CACTTACAAC GACAATTAAa 6720 

SO 

TTGTTCATCT TGATTGACTC GCTCCTTTAA CATTTCAGCG ATCCTTTTTA TTTTTGTAAA 6780 

ATCACTGACG GATGATCCGC CAAATTTCAA CACACTTCTT GTTACCATAT AATCCTCCTA 6840 
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TAATCTATAT ACAAGTGATG CACTCCATTA TTTTTAAATA ATGACAAACT CTCAGCTCTT 6960 
AACCAAAAAG TCCAACAAAT TATAACTGCT ATTATAATTG CTTCGGCATC OCACCCTTTC 7020 

5 

AAATTTAGCT GTTAGCAGAC AGTAATCTAa ACTTTACTCA TGATTGATGC GCCTC 7075 

(2) INFORMATION FOR SEQ ID NO: 264: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 5171 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 264: 



20 



30 



35 



40 



50 



AGACGTACTT 


TGTGATTmCG 


AAGyrCGTAC 


TGmAGCACTT 


GTCGACGTTG 


ATGTACTTGT 


60 


TGAACCTGAT 


TGACTAGTAC 


TTTGTGATAA 


TGACTTACTA 


TCAGAATCAG 


ATGTACTTTG 


120 


TGAATCACTT 


AATGATTCTG 


ATGTACTACC 


TGACTGAGAC 


GTGCTCATTG 


AACTACTTAC 


180 


GGACATTGAT 


TTACTGTCTG 


ATGCAGATAA 


TGACCCACTT 


GTACTGATAG 


AGTCACTTAC 


240 


TATCTCTGAA 


GTACTCATCG 


AGTCTGATGT 


ACTTGTTGAG 


ACACTTTGTG 


ATGCTGCTAT 


300 






AACCACTTGT 


GCTCGTCGAA 


TCG CTCAATG 


ATT CTGATGT 


360 


ACTCATCGAT 


TTTGAATCAC 


TTGTACTTAA 


TGATATTGAT 


GTACTTTGTG 


AATCTGATTT 


420 


GCTTGTTGAC 


GCACTTTGAG 


AGTTGGCTAT 


GCTATTTGAA 


ATACTGATAG 


AGTCCGAGGT 


480 


GCTAGCTGAC 


TCG CTCAATG 


ATGTTGATGT 


ACTAATTGCA 


TTCGATGTAC 


TGTCACTTAA 


540 


TGATGCTGAT 


GTACTAGACG 


ACCCTGATAT 


ACTCGTTGAT 


AAGCTTTGTG 


ACTTAGACAA 


600 


GCTTCCTGAT 


GTACTCATAC 


TTAATGAGTC 


ACTGAGTGAT 


GTTGATGTAC 


GCAATGAATC 


660 


AGATSTACTT 


GTTGATAGAC 


TTTCGGATTT 


TTCAGTACTG 


CTAGAGTTTG 


AAATAGAATC 


720 


GCTTAATGAT 


GTTGATTTAC 


TAGCTGAATC 


CGACATGCTT 


GATGATACAC 


TTTGTGAATT 


780 


CACTAAACTT 


GTGCTTGTTG 


AGCTTGATAC 


ACTATTACTT 


TCAGATGTGC 


TTAATGACTT 


840 


AGATGCACTC 


ACAGAATCAG 


ATAGGCTTAC 


ACTTGTCGAT 


TTCGAGGTAC 


TAGCTGATGT 


900 


AGATACCACA 


ATCGATCCTG 


ATGTACTCGT 


TGATGCACTT 


TGTGAGTCAG 


CTTTACTTGT 


960 


TGACACACTT 


TGAGATTGTT 


GTGTACTTCC 


TGATGTTGAT 


ACGGAATCAC 


TCATG CTATT 


1020 


TCTTGTTACT 


TCATATTTAA 


AAGTTGTCGT 


CGTTTTGTTA 


CCGCTCGCAT 


CTGTAGAAAC 


1080 


GATTGATATA 


GTACTTGTAC 


CAATGTTTGT 


TGGTGTACCA 


CTAATAGTAT 


TATTTGTACT 


1140 


ATCAAATGTT 


AGTCCGGATG 


GCAATCCAGT 


CACTGTATTC 


GTCACCGCAT 


TTCCACTGTT 


1200 
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ATTGGTGTCA CTGTTGGTOC TGTCGTATCC ACAACATTTA TTGTAAAAGT TGTCGTCGAT 1320 

TTGTTATTTG CTTGGTCAGT AGACACAACT GTCACTGTTG ATTGACCAAT TTTTGTTGGT 1360 

GTCCCAATQA TTGAATTCGT TOCACTATCG TAACTTAATC CGCTTOGTAA TCCTGTAACT 1440 

OTATTTGTCA CAGTCCCAGT ACCATTATCC GTTGTAGTCA ATACAATAGG ATTCATTGTT 1500 

TTACCCACTT CTATGGTTTG ATTGCCTACA GTTACAGTTG GTGCTTTTAC ATCAGTAAAA 1560 

TAATATGTCA CTGATTGTCC AGCATTCGTC ATTTTTACAG TTTTATTTGT ATCATTATAA 1620 

GTTGACGCAT ATGAACTATC GACGGACGTG TAGTTATATC CTTTAGCAGT CAATGCAGAT 1680 

15 TGCTGaTTAT CGATTGTCAC GACTTGATCA ACATTTCCTG AATATGTTTT TGGTGGAATA 1740 

ATATCTTTAC CTGTTGTTAC ATCAACGTAT CTCACTTGTG TAnCAGCAGA CTCTGTATAT 1800 

TCGAATGTTC CAAATTGTAC TTGTTGTAAA TTTGTCGCGC CACCTGTTGA GGCTGTCATT 1860 

20 GATAATGAAA AGTTGGTCGT ACCACTTTTC GCAATCCAAT CTGAAATATT ACGTGTCCAT 1920 

GTTTGACCTG CATATTTGAC AGTCATAACC TTTGTATCAC CATTATAGTT AATATCAAAA 1980 

TCTTGGaACG TGTTATTTGT AGGTTGaACA TTTAACTTCG CAGCATTATC AGCTGTTGAA 2040 

CTTGATGTAT ACGTTGTCGC AACACCATAA CTATCTGTTG TTACAAATGC ACCAAACGCA 2100 

CCTCCACCAG CTACATTAGA TGGGTCAGCA TTCGCCTTTG CAGCTGAATT TGGTTTAGAT 2160 

GTATTGTGAT ACGTATCCAA TTTGAAGCCA AATGCGTTAC TTAAGCCACC AATACCTACT 2220 

GCGGCACCGT TTAACCCTGT TTCACCTAAT ACACCTGGTG AAAAGGCAAA ACCGATACCA 2280 

TCTCCACCAT TTCCATGCCC TTCATATTTG TTACCTAAAT TTACTTTTCC AGAAAAATGA 2340 

55 AAACTCTTAT TAGAGTCAAT ACGTGTTCCT AATGTAATAG CACCTTTTTG GCTGTATGCA 2400 

TCCTGTGTTA ACGTCACAAT ACCGGTACTT TGATCATAGG TAGCATTACC TGACGTTGTC 2460 

ATAXATTGTT TTAAGTTATC TTTATTAACT GTAATTGTAT TAGCAGTTAC TGCGGTTGTC 2520 

40 GTCgCTGctG ACG CAAATGT TGACATAGCT AAGCGACTGA AAGTTCGAAG TTTTACTGGT 2580 

GCGGTGCTAG TTGACGTTGT GCTAGTTTTG TTTAAGTTGA CCGAAGATGG CGTTGTGCTT 2640 

TGTGAAGTGT TATTTGATGC AGTA C TTTGA TTTGTTGATG TATTAATTGG TTGTTCTGTA 2700 

CTTGAAGTTG AAGCTACAGA TTTAGTATCA GAACTTGATG TAGTATTCTT TGAGGATGTT 2760 

GATTCTGATG TAGATGTCAA TTTCTCTTGT TGATTGCTTG TACTATTAGT TGTOGAAGTG 2820 

ACCTTTTCAG ACTTTTCACT TGAGACTGTG TCACTATTTG ATGTTTGTAC CGAACTACTA 2880 

TTT t TCGTTA CACTTGTGGA ATCGGCTGTT GATGTTGATG CTTCGATTGT CGTTGAGTTT 2940 

TGATTACCTA CTGTTTCACT TTGTGTGTTT AATTCAGAAG TTAATGGTGC ATCAGAAGCC 3000 
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GTTTTCAGTC COTATCCCGT CATTTTTTTA CTAATGCTTT GATTATCTTO ACTCACTAAA 3120 

CTATGACTAA TAAATGGTAG CCCCATAATT TTGAACATTT CTATTTCTTT AATTCCGGAT 3180 

TTTACCCAAT TTTTTCCAGA TTTATAAAGT CTTACTCTTG TTTTTTCGTT TGCTAAGCTG 3240 

TCATGAAATG CTTTCTGTCT TTTACTCATG TAATAACTCC TTGTATTATC TTTACATTCA 3300 

TTAGATTATA ATATATGCCA CTATTCAATT TAATACAACT CTTTTTTGAT ACAAAAATAC 3360 

TCATTTTGTT AAAATTTGTA AAAATTCaTT TTTATTCGTC TAAATGTAAT CGTTTTCATA 3420 

TTTTTAAAAT TACTTTTTCT CGTTTATGCG TATAATCTTT TTTTATATAA ATTTGGCTAA 3480 

15 TTGGCTTTAT GTTTAATCAT TATAATTGTT TCGTTTTTAA AATAATTATT GTATTAATAT 3540 

ATCTATACCA TCCACCTTTT ATTTATAAAT AGTTAATTTA CAACTAAACG ATAAATATTA 3600 

TATGCAAAAT ACATCTTTAA TATTAAAGTA ATACCAATAT TTTTTCAATA AACCTAGTGT 3660 

20 AATATATGTG TAATTCTAAA AGATTCTTCT TTAAAAATAT AAATACCACG ACATATTGCT 3720 

TTAACATTTT CATTTATAAA GCGAAAAAAT GCATCGCTAC TAAGTTGAAT GTTTAGTAAG 3780 

GATGCATTGA ATTCACTAAA ATGATTAAAT TACTTATATC TTTTCATCTG ATTGATTATC 384 0 

GAAATTTCTT CCTTCTAAAC CTGCTAACTC TTCTTTAGAA GCTGCAGGTG CTTTCATTTC 3 900 

AAATATCTCA TTCACTACTG TGTAATCGTA ATATCCTAAT CTGGCAATAG GTTTAATCGA 3960 

CTTAATGTCC AATTTACCAT TAT CAAGAAT AACCTTATCG TCAATATGAA CTTGGGCAAC 4020 

TCTTCCTATA ACAATATCTA CGGTAGATAC TGGATCTCCA GTTGGAATAC GAAT CGTTTG 4080 

AACGTACTCA CATTCAAAAT GAACTGGCGA TTCTTTTACA CGATATCCTG GAG CTTCTAT 414 0 

35 ACATTTTTCC TTTGTTACAC CTGCAAAATT AAATT CATC C TCTTCTGGTG GCAATGCTTT 4200 

CGATGATAAA TTAACTGCTT CTCTTAAATC ATACGTTGCC ATATTCCACA CAAACCAACC 4260 

TGTCTCTTCA GCATTTTTCA CTGTATCTTT ACGTTCGTGA TCACCAAGAA CGGATTGATT 432 0 

40 TGCTGCGAAC ATAACCATAG GCGGATCCCA AGTTAAGTTT TGATACTGAC TATAAGGCGC 438 0 

TAAATTATCT TTCCCATCTT T CG AT ACAGT AGAGATCCAC CCTATTGGAC GTGGTACTGT 4440 

ACTACTTTTA AATGGGTCGT GCGGTAAACC ATGACTTCTT ACACCTTGTT TTGGCGAATA 4500 

ATTCATACTA TCTTCACCCC TTATAAGTAA TTACATTTAA GGTTACGCCC TCTTTACATA 4560 

AGCGTCTAAT ATAAATAAAC AATTTATTTA TAAGTAGAAA CTATATATGA CGTGGTTGCT 4620 

TATAATTTGC GTTCTTGATT CGAAAAATTC AGATAAGGAT TTATACAATT AATATTTATG 4 680 

ATATCTTTTG TAAATTTAAT TAATTATAGT TACTTCAATC ATGATTAGTT TATAATAATA 4 740 

AAGTGAAATT GAAAAAGACA GCTATTATGC GATGAGCGAA AAACTTCAAG TAAAACAAGA 4 800 
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TAAGTTCAAA AAAGAATTCA AACCTGTTAT GCACTTAAAA GGTGATGCAT TCAATCAACA 4920 

GTTACAATCT TTGATTAACA AATATCCACA AATACAAAAA AATATGAAAT CAQAGTTCAT 4980 

TGCTTATTAT GATAAAGAAA AAAATAGAGA AACAGTAAAA AACTATGCTT GGAACCTTCA 5040 

AAAATCTATA AATGACATTA TGCAATCATA TCCTAGCACA AAATTTGTAC AGTTTTATAA 5100 

AAOATGATOT TTCCCCGTCA ATGGTAGATG GAAATGGCCG TTTAAAATCG GGATACTAAT 5160 

10 

GTATTTC CAT C 5171 
(2) INFORMATION FOR SEQ ID NO: 265: 

1S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3589 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 265: 



25 



30 



35 



SO 



CTACACACTA 


AACCTATTTC 


AGTTATGGGT 


GGTACAGTGA 


TTCTCTTTTC 


ATTTTTAATA 


60 


GGTATTTGGA 


TTGGTCATCC 


TATTGAAACA 


GAAATCAAAC 


CACTTATTAT 


TGGTGCGATT 


120 


ATTATGTACG 


TACTTGGGCT 


TGTAGATGAT 


ATCTACGATT 


TGAAACCGTA 


TATAAAATTG 


180 


GCTGGTCAAA 


TTGCCGCTGC 


CTTAGTAGTT 


GcrrrrrATG gtgtgactat 


TGATTTTATT 


240 


TCGTTGCCAA 


TGGGTACAAC 


GATTCATTTT 


GGATTTCTTA 


GTATTCCAAT 


TACTGTGATT 


300 


TGGATTGTTG 


CTATTACAAA 


TGCAATTAAC 


TTAATTGATG 


GACTCGATGG 


TTTGGCGTCG 


360 


GGTGTTTCkG 


CAATCGGACT 


CATTACAATA 


GGGTTCATTG 


CAATTTTACA 


AGCTAATATT 


420 


TTCATAACGA 


TGATTTGTTG 


TGTTTTATTA 


GG CTCTTTAA 


TTGGUTTTTT 


ATTTTACAAT 


480 


TTCCATCCTG 


CCAAAATATT 


TTTAGGTGAT 


AGTGGGGCTT 


TAATGATTGG 


ATTTATCATC 


540 


GGATTCCTTT 


CTTTACTCGG 


ATTCAAAAAT 


ATTACAATTA 


TTGCATTGTT 


CTTCCCAATT 


600 


GTTATCTTAG 


CAGTTCCATT 


CATTGATACT 


TTGTTCGCAA 


TGATTCGACG 


TGTGAAAAAA 


660 


GGGCAGCATA 


TAATGCAAGC 


TGATAAATCG 


CATTTGCATC 


ATAAACTATT 


AGCTTTAGGC 


720 


TACACACATA 


GACAAACAGT 


ATTATTAATC 


TATTCAATCT 


CTATTTTATT 


TAGTCTTTCG 


780 


AGCATTATTT 


TGTATGTATC 


GCCACCATTA 


GGTGTTGTAT 


TAATGTTTGT 


ATTAATCATA 


840 


TTTAGTATTG 


AATTAATTGT 


TGAATTTACA 


GGATTAATAG 


ATAACAACTA 


CCGACCAATA 


900 


TTAAATTTAA 


TTAGTCGTAA 


GTCATCTCAT 


AAAGAGGAAT 


AGGGAATGAA 


AGCATAGCTG 


960 


TATGGGATAA 


TTTGTATTAT 


ATGGCTTTAC 


TCTTTACAAT 


TTTTTTGTAT 


TAAATTTCAA 


1020 
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ATTTACCGTC TTATGATAGT GCTTTTTATT TTTATTCAGT 


TGGTATATCG 


AAAGGTAACT 


1140 




GCTTTGOAGT TTCTTCAGTC AAATCGAAAT TTCCTGCAGT 


CATTTGATTT AAAAAGTTAA 


1200 


5 


TAAACGCTTC ATAGTCACTT TTAACGACAT CGATATAGTA GCTTACCTTA 


TCAGTGTAAG 


1260 




TTTGGTTTCT TAACATAAAA TGAGTTGAAG CTAATTCATA 


TTCAAATTTA 


CCAGTTTGAT 


1320 


10 


CATAATTCAG TGTTACTATA CATGGTACTG CTTCTCGTAG 


TTCGACACGC 


CCGATATCAT 


1380 


AAATGACGTC TCTAACAGCA CCGCTATAGG CGCGAATTAA ACCGCCACCA 


CCTAATTTAA 


1440 




TACCACCAAA ATATCTTGTT ACTACGACAC ACGCATTATG 


aACATCGrGC 


rrn-iTaATA 


1500 


15 


TGTCTAACAT TGGGaCACCG GcAGTTCCtG TCGGTTCACC ATCATCATTC 


GCnTTTTGAA 


1560 




TATTCATTtC AGGTCCAATA GTATATGCAG AACAATTATG 


AGTGGCATCT 


TTATGTTCTT 


1620 




TTTTTATTGC AGCAATAAAT GCTTTaGCTT CATCTTCATT 


TTGAACAGGT 


TTGATATGAG 


1680 


20 


CAATGAATCT TGATTTACTA ATCACATTTT CAATAATGTG 


TTCTTTTTTA 


ACAGTAATGA 


1740 




TATTTTGTGT CATAATAACT CCTTAATTCA TAAGCTTAAG 


ATTATTTAAT 


CTTCATTATA 


1800 




CACTGAAAAT GACATGACTA TAAATGGTTT GATTGCCATT 


TTCTTTTTAA 


CTGAAATATT 


I860 


25 


GTATCATTGC TATGAGTATA TTTTAGGAGG ACGACTATGA AAATTGCTGT GATGACCGAT 


1920 




TCTACAAGTT ATCTGTCGCA GGACTTAATC GATAAATATA 


ATATTcAAAT 


AGCGCCATTA 


1980 




AGTGTGACTT TTGAAGATGG CAAGATTATA CCAGAAGAAA 


AAGTTCGTAC 


TAAAAAGCGT 


2040 


30 


GCCATTCAAA CATTAGAAAA GAAAGTATTA GATATTGTAA 


AAGACTTTGA 


AGAAGTAACT 


2100 




TTATTTGTCA T AAATGGAG A TCATTTCGAA GATGGTCAAG 


CGTTATACAA 


AAAGTTACAA 


2160 


35 


GATGATTGTC CTTCAGCTTA TCAAGTAGCA TACTCTGAGT 


TTGGTCCAGT 


TGTTGCAGCA 


2220 


CATTTAGGTT CTGGTGGATT AGGTTTAGGC TATGTTGGCA 


GAAAAATAAG 


ATTAACATAA 


2280 




TTApVAAATT TTAATAAAAG AGTCTATATT GTAATTGGAA 


ATTATCTCTC 


GTATACATGG 


2340 


40 


CTTTAAATGT TCATCATTTG AAAGCCAAAA TGCTAAAGAT 


ATAAGAAAAT 


CATTATAATA 


2400 




TTAGGCTCTT TTTTACGTTG AAATGAGGTT TTAAGCATTA 


AACATTACGG 


GAAATTAATT 


2460 




CATCCTCATA CTTCACTTAC TAATGAAAAA ATTAAAAAAG 


AAGTAACAGG 


TGTCATCAAA 


2520 


45 


CAAAATTCAA ACTATTATTG TGTTCAATGT GAAAGTACAA 


ATCCAAAGCA 


TTTTTATCAG 


2580 




TATGATTCCT CAGTACATTC CAAGAAAATT GTATATTGCA 


GAAATTGTAT 


ATCACTGGGT 


2640 




CGAATGGATA ATGTAACAAG ATATAAAATA ACAGAGAGTT 


CGCAAAGTTC 


ATCACAAGCA 


2700 


60 


TATTATCATC TCTCATTTGA ATTGTCGGAA CAGCAGTCTT 


ATGCCTCAGA 


ACATATTGTT 


2760 




CGAGCCATTA GAAAGAGACA AACGATTTTG TTATATGCCG 


TAACAGGTGC 


AGGTAAGACA 


2820 
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TCACCACGTG 


TAGATGTTGT 


TGTAGAAATT 


AGTAAACGTA 


TTAAAGACGC 


ATTTCTTAAT 


2940 




GAAGATATAG 


ACATACTACA 


CCAGCAATCA 


AGACAACAAT 


TTGAAGGGCA 




3000 


5 


TGCACAGTGC 


ATCAACTTTA 


CCGATTCAAA 


CAGCAiri'JL'i'G 


ATACTATTTT 


TATTGATGAA 


3060 




GTCGATCCCT 


TTCCTTTATC 


AATGGATAAA 


AATTTACAAC 


AAGCATTGAA 


GTCATCTTCT 


3120 


10 


AAAGTTGAAC 


ATGCAACAAT 


TTATATGACA 


GCAACACCAC 


CGAAACAACT 


TCTGTCAGAG 


3160 




AAAATATAAT 


TAAATTGCCA 


GCTCGCTTTC 


ATAAAAAATC 


ACTTCCAC3TT 


3240 






GTTATTTCAA ACTTAATAAT 


AAGAAGATTC 


AGAAAATGTT 


ATACCGAATT 


3300 


1S 




AAATTAATAA 


TCAACGTTAT 


ACACTGGTGT 


TTTTTAACAA 


TATAGAAACA 


3360 




ATGATTAAAA 


CATTTTCGGT 


TTATAAGCAG 


AAAATTACTA AATTAACATA 








GAGGATGTTT 


TTCGCTTTGA 


AAAAGTTGAA 


CAATTAAGGA ATGGACATTT 


CGATGTCATT 


3480 


20 


TTTACTACGA 


CAATATTAGA 


ACGTGGATTT 


ACAATGGCAA ATTTGGATGT 


TGTTGTTATC 


3540 




OATGCACATC 


AATATACTCA 


AGAGGCTTTA 


ATACAAATTG 


CTGGACGTG 




3589 




(2) INFORMATION FOR SEQ ID NO: 266: 








2S 
30 


. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1017 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 










(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 266: 






OS 


TTTCCAAGAA 


GGcTTgAAAA AtGTTwCaAG 


TGGTGCGAmC 


CCAGTTGGTT 


T A CV2 A r* A & f3T2 




TATCGACAAA 


GCAGTTAAAG 


TTGCTGTTGA 


AGCGTTACAT 


GAAAATTCTC 


A. & XV A & f2T*T*^l & 
/UUv\nV^ X X wn 


120 




AAATAAAAAT 


GAAATTGCGC 


AAGTAGGTGC 


OATTTCAGCA 


GCAGATGAAG 


AAATTOGAM 


180 


40 


TTATATTTCT 


GAAGCTATGG 


AAAAAGTAGG 


TAACGATGGT 


GTCATTACAA 


TTGAAGAATC 


240 




AAATGGACTA 


AACACTGAAC 


TAGAAGTGGT 


TGAAGGTATG 


CAATTTGATC 


GTGGTTATCA 


300 




ATCACCGTAT 


ATGGTTACTG 


ATTCAGATAA 


AATGGTTGCT 


GAATTAGAAC 


GCC CATACAT 


360 


45 


TTTAOTAACA 


GATAAGAAAA 


TCTCGTCTTT 


CCAAGATATC 


TTACCTTTAT 


TAGAACAAGT 


420 




GGTTCAATCT 


AATCGTCCAA 


TCTTAATTGT 


AGCTGATGAA 


GTTGAAGGCG 


ATGCATTAAC 


480 




AAATATCGTG 


CTAAACCGTA 


TGCGTGGCAC 


ATTTACAGCT 


GTTGCAGTAA 


AAGCACCTGG 


540 


SO 


TTTTGGTGAT 


CGTAGAAAAG 


CGATGCTTGA 


AGATTTAGCT 


ATTTTAACTG 


GTGCGCAAGT 


600 




GATTACTGAT 


GATTTAGGCT 


TAGATTTAAA 


AGATGCATCA 


ATTGATATGT 


TAGGTACTGC 


660 
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10 



IS 



30 



35 



40 



60 



CAGCATTGAT GCACGTGTTA GCCAATTGAA ATCTCAAATT GAAGAAACTG AATCTGACTT 780 

TGATCGTGAA AAATTACAAG AGCGCTTAGC TAAATTAGCA GGTGGTGTTG CAGTTATCAA 840 

AgTAgGTGCA GCAAGTGAAA CAGAGCTTAA AGAACGTAAA TTACGTATTG AAGATGCATT 900 

AAATTCTACA CGTGCAGCAG TTGAAGAAGG TATTGTTGCA GGTGGTGGTA CTGCATTAGT 960 

AAATGTTTAC CAAAAAGTAA GTGAAATTGA AGCTGAAGGT GACATTGAAA CAGGTGT 1017 

(2) INFORMATION FOR SEQ ID NO: 267: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 1409 base pairs 
<B) TYPE: nucleic acid 
(C) STRANDEDNESS : double 

<D) TOPOLOGY: linear 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 267: 

TTAATCCAGC GTTAACTGTA TTTGCATTTA TTATGATTAT TTCGATTCTT TTAGCGTATG 60 

TATTTAAATG GCTTGGATTA GTGGATGATG TGTTATTAAT GGTCATTATC ATTTCAACTA 120 

25 TTTCCTTAGG CGTAGTTGTT CCAACTTTAA AAGAAATGAA TATTATGAGA ACAACTATAG 180 

GGCAATTTAT CCTATTAGTA GCAGTACTTG CGGACTTAGT AACTATGATT TTATTAACGG 24 0 

TCTATGGCGC AATCAATGGT CAAGGCGGCA GTACAATATG GTTAATAGGT ATATTAGTTG 300 

TTTTCACAGC AATTTCATAT ATTTTAGGTG TTCAATTTAA AAGAATGTCA TTTTTACAAA 360 

AATTGATGGA TGGTACGACG CAAATCGGTA TTCGTGCGGT ATTTGCATTA ATAATATTAT 420 

TAGTXGCCCT AGCAGAGGGA GTTGGCGCAG AAAATATATT AGGTGCATTC TTAGCAGGTG 480 

TCGTTGTTTC ATTATTAAAT CCAGATGAAG AAATGGTTGA AAAGTTAGAC TCATTTGGTT 540 

ATGGGTTCTT TATTCCTATT TTCTTTATAA TGGnTGGTGT AGATTTAAAC ATACCTTCAT 600 

TAATTAAAGA ACCGAAATTA CTAATTATCA TACCGATTTT AATCGTnGCA TTTATCATTT 660 

CAAAATTAAT TCCAGTCATG TTTATTCGAC GTTGGTTTGA TATGAAAACA ACGATTG CAT 720 

CAGCATTTTT ATTAACATCA ACATTATCGC TCGTGATAGC TGCAGCCAAA ATTTCAGAAA 780 

45 GATTAAATGC TATTTCAGCT GAAACGTCAG GTATATTAAT TTTAAGCGCA GTCATTACAT 84 0 

GTGTATTCGT TCCGATTATT TTCAAAAAAC TGTTTCCAGT TCCAGATGAG TTTAACCGTA 900 

AAATTGAAGT TAGTTTAATT GGTAAAAATC AATTAACGAT TCCTATAGCG CAAAATTTAA 960 

CATCTCAGTT ATATGACGTG ACATTATATT ATCGCAAAGA CTTGAGTGAT CGTCGTCAAT 1020 

TGTCAGATGA TATCACGATG ATAGAAATTG CTGATTATGA ACAAGATGTT TTAGAACGAC 1080 
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AAGTTGCTAA ATTAGCCAAA GCACATCAAO TTGAGCGTGT CATTTGCAGA CTTGAAAGCA 1200 

CAACGGACGA TACAGAGTTA GTTGATTCAG GTATTGAAAT TTTCAGTAGC TACTTAAGTA 1260 

ATAAAATCTT ATTAAAAGGT TTAATTGAAA CACCTAACAT GTTGAATTTA TTAAGTAATG 1320 

TTGAAACGTC ACTATATGAA ATTCAAATGT TAAATTATAA ATATGAAAAT ATTCAATTAC 1380 

GTAATTTCCC ATTCGGAGGA OACATCATC 1409 



10 

(2) INFORMATION FOR SEQ ID NO: 268: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4702 base pairs 
(B> TYPE: nucleic acid 
15 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 268: 





AAAGAGGGTT 


TTTTACTACT 


ATAATCCATC 


CTTTAATGGA 


ATTCCATTTG 


TCCCTTTGGC 


60 




CCGTTCATAA 


CCATAGGAAA 


ATATATGCnG 


nAATCATTGA 


TAGTAAATAC 


ATCAATAATA 


120 


25 


CGAAXAATGT 


CGGTGAAATC 


ACGTCCGTAT 


TACCATTATT 


AGCTAAAACA 


TTTTCCAAGT 


180 




TTTCTTTTGA 


ACCGGATACT 


CATAAATGCT 


TTTAATGCnT 


GGTTTTGTCT 


GTCGCCATCT 


240 




TTAOAATTTG 


TAATACTTTT 


TTAAATTCTT 


TAGCGAACAA 


CTCATTATCT 


TTATCGTTTT 


300 


30 


TAGCCATTTG 


ACGATTCAAA 


TCGTTAGCTC 


TTACGCCTAA 


TGCTCGACCT 


. GTCGCATGTA 


360 




GCTTATTCAC 


ATTATTGTCG 


ACTTGATTTA 


ATTGGCCACT 


AACAGAATCT 


GCAATTGATT 


420 


35 


TTGATTCTTG 


TGTATCTGAT 


AGCAATTGCG 


TACTCTTTTC 


AGAAATTCTA 


. CTAATTTCTT 


480 


TATCTAAATT 


TGAAGACATC 


GTATTAAATT 


CATCATTTTT GCCTTTATCA 


ATTTTTGGTT 


540 




CTTGTGGCTC 


TTCAGCAAAA 


GTCTTTTTAA 


CGTTTTCTAA 


CTGATCAATC 


AGCTTGGAAA 


600 


40 


TATCTTCTTJc 


ATTTTTTGTT 


gTATTCTTTT 


TGTTATTTAA 


AATGTCATCA 


ATCAGTTTGfT 


660 




CTGAGTTTTC 


TTCCATTGAA 


TCAATTTGaT 


GTAACACAGC 


TACTTTATCG 


TCTTTGAAAC 


720 




TTTCCATGTC 


ATTGATAACT 


TGGTCAACCA 


TCATATCAAT 


TAAACGTTTG 


TTGTCGAATG 


780 


45 


GTTTATCTTC 


tCTGCCTTTT 


GTATCTGTGT 


ACATTTTATA 


ATGCGCATCA 


AACCTAGATA 


840 




ATGCACTCAA 


TTGCTGGCTT 


AATGCATCTT 


TCGATAAGCG 


ACCATCaAGG 


TTATGATTCA 


900 




ATGTTACATC 


CACAACACTC 


GTTGCTTTCT 


TATCATTTGG 


TTCATCTTGA 


CGATTTGCTT 


960 


60 


GTCCAAATAA 


CAATTGTAAA 


TGCATTGTTT 


TATCTTTTAA 


GAAATCTTTC 


TCAGCATCCT 


1020 




TTTTCAATTT 


AGCAACGCCA 


TTGACTTCAA 


CTTTATATTC 


CTTGTTAGAT 


GTATCGAGTT 


1080 
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TAAAATGAGG 


AtCTGTTGCA 


ACAGTTAATT 


GATTAATATC 


ATTACTTTTA 


ATCGTTTCAG 


1200 




TACQTTGCAC 


TTTGACACCA 


TCATTAATCA 


AACTACTTGT 


GTCTTGCGCA 


ACTTGGTTAT 


1260 


s 


CGTAATCTGT 


TAAATTAATG 


TGTTCTGCTA 


ACGGTTTTTT 


CAAATTATAT 


TCATTTTTAT 


1320 




AACGTTTTGC 


TTCTTTGACA 


ATTGCTTCQT 


ATTTATTAGC 


TTCATCCTCA 


TTTAAACCTG 


1380 




CAGCTATAAA 


GTCTTGTTTA 


GACATGTTAT 


AGATAAATGT 


TGTATCTGTA 


TCAGGTTCTT 


1440 


10 


TGACAATATC 


ATCATGAAGT 


TGTTTCTCTA 


AGTTTTCAGC 


GAATTGAOCA 


TTGTTCATTT 


1500 




TAATGCTATT 


TAGCGCATCT 


TGTAAGTCTT 


TGTTATTTGC 


AAGCTCATCT 


TGCAGTGATT 


1560 


15 


CTGTTAATTG 


CTTACGATAn 


TCTTCAATCA 


TACCTTTTGA 


AAATGGTGAC 


TCTTGTGATT 


1620 


GAATGATTTC 


TCTTAATTTA 


TCTAAGTTTT 


CTTTAACAGT 


TTGTTTATAT 


TCTTCTTTAC 


16B0 




CTGTATCTTG 


CATACTTGAT 


TGTTGATCAA 


TTTGGCTGTC 


CATCTGTTTT 


AATGCAtTGA 


1740 


20 


TATAGTTATC 


AAGTTCCACG 


ctatcttttt 


GCGATTTATA 


ATCTTGTAAC 


ATTTTATCCA 


1800 




TCGCTGTATT 


GTGCTCGTCA 


AATAATGAAT 


TTTGTTTTTC 


AATTAAAGTC 


GAAACATTAT 


1860 




AATCTGTGTT 


CACTCTGAAC 


GTATCTGAAT 


TCGCACTCAA 


TAATGATTTA 


TTGTATGTTT 


1920 


25 


GGAACCATTT 


TGTAATGTCT 


TTGTTTGCAG 


AAATTGAATT 


TACAAG CGTA 


TCTGTAAATA 


1980 




ATTCCGGGAA 


GTCGTTAATT 


GGATTTAATA 


AGTAATTCGA 


GAATTTACTA 


TTCACACCAT 


2040 




GTTCACGCGT 


CATAATAGCG 


CCAACATTTT 


TTTGTGCATT 


ATGTAAATTA 


TCAATGATGC 


2100 


30 


TTGTTAAATA 


AATTTCGACT 


AAGTTTTTGT 


TAAAGTCGTT 


AAGTACATTA 


CTTACAACTT 


2160 




TTTCTGTGTT 


TTTAGCTACT 


TCTTCTTTTT 


GTCCTACAGC 


TGTTTTATAC 


TGTAGCGATA 


2220 


35 


TTTTCGATGG 


TGTTTTAGCG 


TCTAATTGCA 


TTGCCAATTT 


TGAAAAGTTT 


TCTGGGATAA 


2280 


CAATCATGAC 


TTGGTATCCA 


CCATTTTTCA 


AACCAGACTC 


AGCAACGTTT 


CTTGTTACTG 


2340 




TTTCAAATTT 


ATAGTTTTTC 


TCATTTGCTA 


ACCTTTTAAT 


AAATGCTTGA 


CCCAGCTCAA 


2400 


40 


CTTTTTTACC 


GTTATATGTC 


GTTGGTTGAT 


CCTCGTTAAC 


AATTGCGATA 


TGTATTTTAT 


2460 


TATTTTTATT 


ACTTACACTT 


TGGGATCCTT 


TTTCTGATTG 


ATCTCCATAT 


TTTGTTTGAA 


2520 




CAAAAAATAT 


CATACTAACT 


ATGGCAATTA 


TAATAATTAA 


AGTGACAATT 


AATGCATAAA 


2580 


45 


TCCAATTTTT 


CTTTTTCATG 


CTTATTTCCT 


TTCAGTTGTT 


TTCTTAAAAA 


AATGATAAGC 


2640 




AAAGCCACAT 


TAGAAAATGT 


GACTTTGCCA 


ATTTCAGAAT 


GCTTATTGCA 


AACCGAAATT 


2700 




ATTAGAAAGT 


TGTTGGTCTT 


GTTCTTGAAC 


GGCATCAGCA 


GTGC t ATTcA 


ATTGTTGTTT 


2760 


50 


AATTTCTTCT 


AATAATTGTG 


CAAATTTTTC 


TACTTTAGGA 


CTAAGTTGTT 


GGAATTGCTC 


2820 




TTCGAAACGG 


CTGAAAGCTT 


GACCTTCCCA 


GTTCGCTGCA 


ATTTCACCTt 


GTGCACGkGT 


2880 
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TCTGATTTCC TCTGGACTCA TCTTAATCAT TGCCATAACT AGAAACCTCC TGAATATTTT 3000 

AAGTTTATCa AAACTTTTTA GGGACACTAT TTTTTGAAAA AGTGCTCCTT ACTCAAATAA 3060 

TATATAAATT ATTAGTATAT GTATATAGTt TTTTAAGTAT TTTTAGCTTT TTTAAAATAA 3120 

ATATATTGAA TATAACCATA TATTTTTAAT TAACCATTCA TTTTTGTAAT ATAAATGTGT 3180 

ATACTAAAAT TAAATTAAAT ACATAAAGGA TTAAATGGTT ATTATGAAGA AAACAATTTT 3240 

ACTGACGATG ACAACTCTTA CTTTATTTAG TATGTCGCCT AACTCGGCTC AAGCATATAC 3300 

GAATGATAGC AAAACATTAG AAGAAGCAAA GAAAGCACAC CCAAACGCAC AGTTCAAAGT 3360 

GAATAAAGAC ACCGGCGCGT ATACTTATAC ATATGACAAA AACAACACGC CAAACAACAA 3420 

TCATCAAAAC CAGTCACGTA CAAACGACAA TCATCAACAC GCAAATCAAC GTGATCTTAA 3480 

CAACAATCAG TACCATTCTT CATTAAGTGG TCAGTATACG CACATTAATG ACGCAATTGA 3540 

20 TTCACACACA CCGCCTCAAA CGTCACCAAG CAATCCTTTG ACACCAGCAA TACCGAATGT 3600 

CGAAGACAAT GACGATGAAT TAAATAACGC TTTTTCAAAA GATAACAAAG GGCTTATTAC 3660 

AGGCATCGAT TTAGACGAAT TGTATGACGA ATTACAAATC GCCGAATTTA ATGACAAAGC 3720 

25 AAAGACCGCT GACGGTAAAC CTTTAGCATT AGGTAACGGT AAAATCATTG ATCAGCCTCT 3780 

TATCACAAGT AAGAACAACT TATATACTGC TGGACAATGT ACATGGTATG TCTTTGATAA 384 0 

ACGTGCCAAA GATGGACACA CGATTAGTAC ATTTTGGGGA GATGCTAAAA ACTGGGCAGG 3900 

CCAAGCTTCA AGCAATGGCT TCAAAGTAGA TAGACACCCA ACACGAGGAT CAATTTTACA 3 960 

AACAGTAAAT GGTCCATTTG GTCATGTAGC CTACGTTGrA AAAGTTAATA TTGATGGAAG 4020 

TATTCTAATT TCAGAAATGA ACTGGATTGG TGAATATATC GTTTCATCAA GAACCATCTC 4080 

TGCTTCAGAA GTTTCATCAT ATAATTACAT CCATTAAATT AATCATGACA TCAATAAAAA 4140 

GCGA€CAGTT CGCAGTTTAC AATTCGTAAC ACTGCAAAAT TGGTCGCTTT ATTTTGTATG 4200 

TTATTCGATT ATAAAATTAC AAAGAAATGT TCTCTACATT CCCCATTAAT CAAAATCGTT 4260 

TACGAAAGTA TAATTGTAGC T AT AAT AAT C CAAGTCGTAA CAACTAGTGG CACTATCGTC 4320 

TTGAATAAGA ATATACCGTA TTTTTTCTTG CGATATATAT CCAGTACTAG CCAAATTAAA 4380 

45 ATG ATTATAA CACCAACAAA AATAAATACA GGATTCATCG ATATAGCATC TGCCTGTAAC 4440 

TCAGGTTGCA TTCTTAATTT AGTGATAATT AACATCACTA CTGAAATAAT GAAAAAGTAG 4 500 

ATACCTCTTA TCTTTGATGT CTGTAAATCT AATTCCTGCT CTTCAATGAC CTCTTTAGAT 4560 

50 TCACCCAATT CTTTTGCAAT CAAATAATTT ACTACCTTAG GTTTCACCCA TAAACACTTA 4620 

ATTGCAAAGT ACATAAAAAT ATATGATCCA GTATCCATAA ACATTAAAAA GTTGCTTAAA 4 680 

55 



30 



35 



40 
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(2) INFORMATION FOR SEQ ID NO: 269: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 2004 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) topology: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 269: 





ACAAAAAATT 


CACCCTCATT 


AATATTGAAA 


CTAATGTTAT CGACAGCAAC 


ATGTTTGCCA 


60 


1S 


TAACGCTTAG 


TTACATTTTT 


AAACTTAATC 


ACTTTGCCAC CTCTTTTTTT 


CTCATAGCAT 


120 




AAAACCGAGA 


TTATATGTAT 


GTATTCCCTA TTTAACCACG TTTATTACAA TTTTCAAATT 


180 




TAAATGATTT 


ATCCTTGAAC 


TTTTTTAATA AAATAATGAA TAAwAGGwAA TCwCCAGTTA 


240 


20 


AGAAATAGTG 


TTATTTTACC 


TTGAATTCAA 


AAAAACACCC AGTAAAACAA 


GGAATGCTTA 


300 




CTAGGTGTCT 


TCACTATACT 


TTGGCTTTAT 


AATTTTGAAT CGTTtCTAAA 


AATGCTGGAC 


360 




AATAATGTTT 


TAATTTGTAA 


CTACCTACGC 


CATCtnATATT AATCATATCT 


TGTTTCGAAG 


420 


25 


CAGGCTTACG 


TTTAGCAAAT 


TCCTCCAACG 


TGTAATCAGA AAATATACTT 


ACAGGTG CTA 


480 




TCGTTAATTT 


GTCACTTAAC 


TTTTTACGAA 


CTTCTACCAA CTGACTGAAT 


AATACTCGGT 


540 




CAACCCCTTC 


AACCGTATTT 


ATAAATACTT 


TTTCAGTCGC TTTTTGCTTA 


AATGGTGTTG 


600 


30 


' TGAATACTTC 


TACTTCATTA 


CTGAGTAATT 


TTTTAATTGA AGTATCACAC 


ATTAATATTT 


660 




CGTCATTTTC 


ATTTAAGAAC 


CCTTTGAATC 


TTAATTCATC TATTAAGTGA 


CTTAATTCTG 


720 


35 


ATGTTGTGTA 


ACCTTTCATT 


AAACCATGGG 


TTGAAATTTG GTCATAACCT 


TTATACTTAA 


780 


TATAATCTGk 


TGACTCTCCT 


CTTAACACTT 


GAATGATAAC ACTATAACTC 


TCTTGTTGTT 


84 0 




TCATACG AG C GATGCAACTA ATAATCATCT 


TAGCTTCTTG TGTCATATTA 


TATGATTTAT 


900 


40 


CTTGTTGAAC 


ACAATTACTA 


CATTGTTCAC 


ATTCTTCTAA TTTTTCATTC 


GGTTCAAAAT 


960 




AATGGACAAT 


TGTTGCTTCT 


AGACATTTTT 


TTGTri'ITGT ATATTGAATC 


ATTTTAGTTA 


1020 




ACTTTTCGCC 


CATTTTATCT 


TTATAGTCAT 


CATCAGCTTG AGAGACTGTT 


ATAAAATACT 


1080 


45 


CGTGTAAATT 


GATAt CGCGT 


TCGCTAAATA 


ACAAAATACA TTCACTTTTC 


AACCCGTCAC 


1140 




GACCTGCACG 


ACCCGCTTCT 


TGATAATAAG 


ATTCTAAATC TCCAGGCATA 


TTATAATGAA 


1200 




TAACAAAGCG 


TACATTGGAT 


TTATCAATAC 


CCATACCAAA AGCATTTGTA 


GCAACGACTA 


1260 


60 


CTTTAACACG 


ATCAAATAAG 


AAATCATTCT 


GCGCTTCTTC TCTTTCTTTA 


TTGCTCAAAC 


1320 




CTGCATGATA 


TATAACACTT 


TCAATTTTCT 


GACTTTCTAA GGCTTCTTGA 


AGCTCTTCAA 


1380 
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CCAATATAAA TTTTTGACQT TGATAAGTAG GATTTACTTT AAAAATTAAG TTTCTACGCT 1500 

TAGTACTCGT TTTAATTTGA TCAGTTTGAG CGATATTTAA CTTTTCTCTA ATATCTTGCT 1560 

GTACTTCAAC CGTGGCAGTT GCTGTCAACG CTATTATTGT AAAATCTTGA GGTAACGTAA .1620 

ATACTTTTGA AATAACATTT TGGTAACTCG GCCTGAAATC ATGACCCCAT TTAGAAATAC 1680 

AATGCGCTTC ATCAAACGCG ACTAAGTGAA TCTTTATACG CTGAAGCATA TTTAAAAAAT 1740 

ATCGGTTTTC AAATCGTTCT GGTGCAACAT ACAAAAATTG AATTTCTCCA TTTGATAATG 1800 

CTTTTTCAAT ACGTTGTTGC TCTTTTTGAG TCAAACTACT ATTTAAAAAA GCAGCTTGAA 1860 

TTCCCATCGC TTTTAATTGA TCCACTTGAT CTTTCATTAA TGATATTAGT GGACTTATTA 1920 

CAATTGTTGT ACCACCTAAC mATAAACCTG GTACTTGrTA GCmTATAGAC yTACCTCCAC 1980 

CAGTtGGkAA GrCACCAAGC ACAT 2004 
20 (2) INFORMATION FOR SBQ ID NO: 270; 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2244 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 



10 



IS 



30 



35 



40 



so 



ss 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 270: 

AAAGATTGCT TGCCTTGAGG GTTTATATAT CTGACTCAAT TGCCACATTT TTATCAAGAG 60 

TAGTTGATAA TACTCATCAT AATTATAGCT AATATTATAT TTTTTTAAAA GATAGTGTAT 120 

GATTTTCTGG TGTTTGTTGT ATACGTCATT AAATTTCAAG TAGTCATTCT. CCAAGTTATA 180 

CGTATAACAA ATATTTCCGG ATAAAGTTAG AATAAAATAT . TT AGAAAAAT CATTCATTTG 240 

CGTAATCGCT AAATTAAGTG TTAAATATAA GACATAAGTA ATTAATTTAA TGTGATATGA 300 

TGfTATTATTA CTTTGCTAAA TAGTAGATAG AACAAAATTT GTAATCGGGA GGTAACAATG 360 

GATTACGCAC ATTTAAATTT AGAACATTTT TTTGCACGAA ACGACGATTT AGATGTTATA 420 

AGAGATCGCG CTGATTTCGT GATGATAAAT AACTTCACTA ATGAAATGAT GTATCGTGAT 480 

GGTCAAATTG AAGGCACGAT TGATTTAAAT CAGTACTATT ATAAAAATAG ATCAAATGCA 540 

GCAAGTTTTA TTATGATGGA TTATAAAAAA GAAACTAAGT AAACGAACAA AAGAATTTTT 600 

TGTTTTTTAA TACGTGAATA ATAAGATTAT TGATATAAAG GTTTTCAAAG GTTATACAAA 660 

AAGATAAAAC ATTTATGATT CGTAGATCAA CGTAAAGTAA TGTTGATAAA TGGTTTAAAA 720 

CGTTTCATTT ACATTACTGT TTATTTATGA ATATGTAACA ATGCATAGAT AAAATTGTTA 780 



1081 
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ACCTAAGAGG TGTGGATATG AATAAACACA AGAAAGGTTC TATTTTTGGA ATAATAGGAC 900 

TTGTTGTCAT ATTTGCTGTT GTCyCaTTTT TATTTTTCTC AATGATATCC GATCAGATAT 960 

TTTTCAAACA TGTTAAATCC OACATTAAGA TTGAAAAGTT AAATGTTACA TTAAACGATG 1020 

CAGCAAAGAA ACAAATAAAT AATTATACOA GTCAACAGGT ATCAAATAAA AAGAATGATG 1080 

CATGGAGAGA TGCATCTGCA ACTGAAATTA AAAGTGCAAT GGATAGCGGT ACTTTTATCG 114 0 

ATAATGAAAA GCAAAAATAT CAATTTTTAG ATTTATCAAA GTATCAAGGG ATTGATAAAA 1200 

ATAGAATTAA ACGTATGTTA GTAGATAGAC CAACGTTATT GAAACATACG GATGATTTCT 1260 

TAAAAGCTGC TAAAGATAAG CACGTTAACG AAGTTTATTT AATTTCACAT GCATTATTAG 1320 

AAACTGGCX3C AGTTAAAAGT GAATTAGCTA ATGGAGTCGA AATTGATGGC AAAAAGTACT 1380 

ACAATTTCTA TGGAGTAGGA GCCCTTGATA AAGACCCAAT TAAAACAGGT GCAGAATATG 1440 

CTAAAAAGCA TGGTTGGGAT ACACCTGAAA AAGCTATTTC AGGCGGTGCT GATTTCATTC 1500 

ATAAGCACTT CTTATCAAGC ACAGATCAAA ATACATTGTA TAGTATGAGA TGGAATCCAA 1560 

AAAATCCAGG AGAACATCAA TATGCTACAG ATATTAAGTG GGCAGAAAGT AATGCAACAA 1620 

25 TTATCGCTGA CTTTTATAAG AACATGAAGA CTGAAGGAAA ATACTTCAAA TACTTTGTGT 1680 

ATAAAGATGA CAGTAAACAT TTGAATAAGT AATTTGATAA GCTACGAGTT GTTTTTATGA 174 0 

CTCGGACATA CTAAAAAGAC GCTTTCTATC TTGTTTTGAT AGAAAGCGTC TTTTTGCATT 1800 

30 AGAGAAAACA CATTGATkGA TAAtCCCaCC aATGCAAgTG GGGcAGGACa TCGATAAAGA 1860 

ATTACTTTTT CTTTAGAAAT TAGTATTTCT T ATG CATGAG TTTTACTCAT GTATTCCTAT 1920 

TTTTAAGTAC ACATTAGTTA TAGCTAATGA TAAAGAACCA CTACATAATA AATCATTAGT 1980 

GTTTTTTTAT CATTTCTGTC CCaCTCTCAT CGTGATTTGA AATTTTCAAT TGCGATTTTA 204 0 

ATTTCATCTC TTACACGTTG GAACTCTGAC CAAGGCTTGC CTGCAGGATC ATCAAATCCC 2100 

CAATGTTCTT TCTTAACATT TGTTGGTAAA GAAGGGCAAT TTACGTCTGC ATCACTACAT 2160 

AATGTAACAA CTAAATTTGA ATTTnTAATA ATATTATTAT CGGATTAAAA TCTGATGGAT 2220 

GATTTGATAT ATCAATGCCT ACTT 2244 
45 (2) INFORMATION FOR SEQ ID NO: 271: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1371 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
60 (D) TOPOLOGY: linear 
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ATAAGCAATT TAATTTTGAG TCTACAATGG AGGAATTATC ATCTTTATCA GAGACTTGCC 60 

AACTTGAAGT GTTGGQTCAA ATTACTCAAA ACAGAGATCG TGTAGATCGC AAATATTATG 120 

5 TTGGTAAAGG TAAAATTGAA GAAATTCAAG CATTTATTGA GTTCAAAGAT ATTGATGTAG 180 

TCATCACAAA TGATGAATTA ACGACTGCAC AATCCAAATC ACTAAATGAA GCTTTAGGTG 240 

TAAAAATTAT TGATAGAACT CAGTTGATTC TTGAAATATT TGCATTAAGA GCAAGAAGTA 300 

10 



15 



20 



25 



30 



35 



AO 



AAGAAGGTAA 


KIWM/iK H /MBit 

ATTGCAAGTA 


GAGCTAGCAC 


AACTTGATTA 


TTTATTACCT 


AGATTGCAAG 


360 


GCCATGGTAA 


AAGCCTTTCT 


CGTTTAGGTG 


GCGGTATTGG 


AACTAGAGGC 


CCTGGTGAAA 


420 


CGAAGTTAGA 


GATGGATCGC 


AGACATATTC 


GAACTCGTAT 


GAATGAAATT 


AAACATCAAT 


480 


TGCGGACGGT 


AGAAGAACAT 


CGCGAAAGAT 


ATCGAAATAA 


AAGAAATCAA 


AATCAGGTGT 


540 


TTCAAGTAGC 


TTTAGTTGGT 


TATACAAATG 


CTGGTAAATC 


ATCATGGTTT 


AATGTTTTAG 


600 


CAAATGAAGA 


GACGTATGAA 


AAAGATCAAT 


TATTTGCAAC 


GTTAGATCCT 


AAAACACGAC 


660 


AAATTCAAAT 


AAATGATGGA 


TTTAATTTAA 


TTATTTCAGA 


TACTGTTGGT 


TTTATACAGA 


720 


AACTACCTAC 


GACGTTAATT 


GCAGCTTTTA 


AATCAACTTT 


AGAAGAGGCT 


AAAGGTGCAG 


780 


ATTTATTAGT 


ACATGTCGTA 


GATAGTAGCC 


ATCCTGAATA 


CCGTACGCAG TATGACACAG 


840 


TTAATGATTT 


AATCAAACAA 


TTAGATATGA 


GTCATATTTC 


TCAAATAGTT 


ATTTTTAATA 


900 


AAAAGGACTT 


ATOTGATCAT 


GCATCAAATC 


GTCCAGCAAG 


TGATTTGCCT 


AATGTTTTTG 


960 


TTTCTTCTAA 


AAATGATGGT 


GATAAATTAC 


TTGTTAAGAC 


GTTATTTATT GATGAAATCA 


1020 


AAAGGCAATT 


AACTTATTAT 


GATGAGACAA 


TTGCGACGAA 


TAATGCAGAT 


CGATTATATT 


1080 


TTCTAAAACA 


ACATACATTA 


GTGACTGAAC 


TTAAATATGA 


TGAAATTGAA 


AATGTTTATC 


1140 


GTATAAAAGG 


ATTTAAAAAA 


TAATAAAAGG 


ACGAAATTCA 


AATGAAAGAT 


ATAAGTAAGA 


1200 


TAGTAGCTGA 


CGTCGAATCA 


ACGTTAGCAC 


CATATTTTAA 


AGAAATTGAA GAAACAGCAT 


1260 


ATATTAATCA 


AGAAAAAGTA 


TTAAATGCAT 


TTCATCATGT 


CAAAGCAACC 


GAAAGTGATC 


1320 


TACAAGGATC 


AACAGGATAC 


GGGTATGATG 


ACTTTGGACG 


TGATCATTTA 


G 


1371 



(2) INFORMATION FOR SEQ ID NO: 272: 

45 <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6035 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) topology: linear 

50 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 272: 
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CGTAAAcCTA 


TGCUTTUTAA 


TATTCTGAAG 


TTACTTAGTT 


CATCCTCAGT 


TTCATCCATT 


120 




TGTTTAATAT 


AAATAATACA 


TCCAGCTGCT 


ACTAAAAATG 


CTAATCCTAA AAATGATGTA 


180 


5 


ACAAATATTA 


GAATACCGTT 


AGTAGCATcG 


ACCTCTTTTT 




ATACGTGATG 


240 




ACTTTOTCTC 


CAAACTGTTT 


TGCAATTGCT 


TGAGCTTTTT 




J» \J X X A V9 ± ± A 


300 




ATATCATATC 


CATAAAAAGT 


ATGAACGTTA 


TTTTGTGTTT 


TCAACTGCTG 




360 


10 


GGACTTACTT 


CGATGACAGG 


TGAGTTGAAG 


CTTAGATTTA 


AAGGATAAAC 




420 




TCTTCTTGTG 


TAcACGGAAA 


GTTTCATTCT 


TAGTACCTTT 


TACTACTAAA 


TCTTTGTTTA 


480 




AATGGATATT AATAATOTTA 


GGCAGCGATT 


TTOTATTTGT 


AATGATGGCA 


ii\*i~x\jCCTG 


540 


1S 


TtAACTTGTT 


ATTTGCACTT 


AAAATAGAAT 


TCGTGOGACC 


TGAATCACTA 


CCATTTTCCA 


600 




AAGTAATAAC 


CTGATCATTA 


ACATTATCTA 


CAGTAATAGT 


TTCGTAAGCA 


TTTTTAGAAA 


660 


20 


ATGTAATTTG 


TTGTTGGCTT 


AGTTTAGTTT 


CAAATTGTTT 


AGCATCTTGA 


GTAGCGACCA 


720 




CGTTAAATTC 


ATTTGGTGCC 


ATAGATGTAA 


GGGTTTGATC 


TGTATTTGAT 


TTAGATAATG 


780 




CCGCAAAACA 


CAATACAGTT 


ACTGTAACTG 


CAGAAATAAT 


TGCAATGATA 


GTTAAAGACA 


840 


23 


TGGCATTTTT 


CTTCATTCTG 


TACATAATAG 


AOGATGTGAA 


TACAACATCG 


GTAATAGATA 


900 




CGCGTCCATT 


TTTTGATTTT 


TTCAATGTTT 


TAAAAATAAG 


TGACACGGAA 


CTTCTGAAGA 


960 




ATAAATAGGC 


GCCTACAACC 


GTTAAAAATA 


AAATGATAAA 


CGGTGATGTC 


ATAGCCATAG 


1020 


30. 


TTAGTGCTTT 


GAACGTACCA 


AACATTTCTG 


TCGCCATATA 


ATAGCCTAGT 


GCAATCATAG 


1080 




CAATACCTAA 


TACGCCTGAA 


ATAACCTCTG 


CAGTOGTTAC 


TTTAGCAGTT 


GTGGCATCAG 


1140 




TTTTAATTGA 


ATCTTTCATC 


ATTGATAAGA 


TACTACGTCT 


TTTTAGAAAT 


AAAGCACTTT 


1200 


35 


GAAATAAAAT 


CAGTACATAC 


GCAATAATTA 


GCATGAAAAT 


AGTTAAAACA 


AGGGCCATAG 


1260 




GTTCGAAATG 


TATCGATAAG 


TTAATCGATA 


ACGACATCAA 


TTTAGATACT 


AT WjAAAkj UL/V 


1320 


40 


ATAaTTGTGC 


ACCTGCAATG 


CCACATAATA 


CACCGACAAC 


ACL x\a l\xf\X X 


A A 7\ TV ATA /""V!I A 

AAAAA 1 AUjA 


1380 


TCATTtGTTC 


AAGTGCTAAC 


ATTTnCAAAA 


TGTTTTGTCG 


TGTTAAACCA 


ATCaACTGAA 


1440 




ATAGCGCAAA 


TTCACGTGTA 


CGGCGTTTTA 


CGrmTAAATG 


ATTGGCATAC 


ATTAAAAAGA 


1500 


45 


TGACAATAAT 


GATAAATAAA 


AATATTGATC 


CGACTAAAGC 


ACCTTTCTTA 


ATGATGGCCA 


1560 




TCGAGTCGTC 


ATTATTTACA 


CCTTTAGTAA 


ACTGTAAGGT 


TGTAAAACTG 


AAATATAAGA 


1620 




CGATGCTAAA 


AAATAATGAA 


AATAAATACA 


TTGCATAATG 


TTTTAAGTTT 


TGTCGTAAGT 


1680 


60 


TTTTGAAAAC 


GATATGGTTA 


AATGTCATTT 


GAGACACCAC 


CTAATACTGA 


TTGAAGATGT 


1740 




ACAATGTCTT 


CATAAAAGGC 


CTGTTTAGAA 


CGTCCTTCCT 


GATAAAGTTG 


TGTATGAATT 


1800 
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AUUii X VUiWVt 


X4V»X xvx#%x^ 


& & JifYZIX.T'l*rA_ TTPATTTCTT 


CCAAACGTTG 


TAATAGGTCA 


1920 




TTTRPAPTTT 

X * X W^i^^W X A A 


TCGAGTCGAG 


TGOGCCTGTT GGCTCATCTG 


CAAATATGAT 


TTGTGGTTTG 


1980 


5 




UiWi V#W X WVa> 


A X X * * ■* * * ^ A w*v 


CACCAGATAA 


TTCGCTAGGG 


2040 




- Inl X X X XXV* 


V- liMJUiiunAn 


AATACCTAAT GCTGTCGTGA 


TCGCTTTATA 


ATTTTCTTCC 


2100 


10 


Al A VJ X X 


X\_uwm%X XXX 


TTY^AAf^ARAT AAJVGGTAACA 


TAATGTTTTC 


TTTAACGGTT 


2160 


An iva Is lAslv^A 


unhlnL x\J A A 


#\XW X XwVzfwVaV niunnnvviA 


ATGATTCTTT 

A Wl X X w * * » 


GCGGAATTTG 


2220 




K/ Ml 1/1/ 

GCAAGTGCTT 


TTTGATTAAG 


i 1 XAA lAnuC A*- 1 1 va IV. vA» X 


InULnn X y 


eTACOGCT AG 
w x nvvvV x*%vj 


2280 


IS 


AAATTTGGTC 


AATTGAACTT 


AGTACATTTA ATAAGGTTGT 


v. X InWC Xun X 




2340 


CCATAATCGC 


AACGAATTCG 


CCTTTTTGTA TGTCAAAGTT 


AATATCTTTA 


Aw AwL X iunA 


2400 




ATGTGTGCTT 


TTTACCGTAT 


A"A~A~A~A\iAAA CA"A\iTy v_AV_ 1 


unlnnlni\A> 


X 1AVI X W X ^> 


2460 


20 


ACTCCTTtTG 


TATTTAATTT 


CATTTTAaAT AA'l\i'lTIwA 




X X A X l> liinHL 






TTACAATTCA 


ATGAATGAAC 


CTTACAGAGT TGAAAXCTAT 


CG CT ACTTAG 


TAGATTTTTG 


xDOU 




AGTGAGGATA 


CAGATTCATC 


GTACATATTA GACAAAAGCA 


ATGGTGCTTT 


L. lAAu luAlvj 




25 


ATGTTTGTGT 


AAATTGAGAA 


AAGGGAATTT AATTATTGTA 


TAATAaATTT 


niuTAAAAA 


^ / UU 




TTAAAAGAGG 


GTTTTATTTG 


AAAGGAATTG ATTGTTATGG 


AAAAAGGAAA 


TCAAGGTATT 


/OU 




AAATGGTCTA 


GTTTAATAAT 


GGGTGTATTA TTATTAATGT 


TGGCAGTCGT 


TATTTTTACA 


O Q *> rt 


30 


TTTCCAATTG 


AAAATTTTTA 


TGCTATTACC TGGTTGATTG 


GACTGTTTGT - 


ATTAATTAAC ■ 


oo on 




GGTGTGATTC 


AAATCGTTTA 


CCGTAGAAAA GCAAAAGCTT 




iAAULAAAnl 


5Qdfl 


35 


TGGATTCTGT 


TTATGGGGAT 


TGTAGATATT CTATTTGGTC 


. lAl lnul XAA 


-XXX innliJl X 


ouuu 


GGCQCAAGTT 


CAGCATTdT 


TATTTATATG TTTLKJ1 ii ii 




XnVJX X^-XAXW 


3060 




TCTGGATTAT 


TTACGTTTTC 


(AAjTAuIuu 1 AV»W X X HhnHW 


IaAI X X V-nw X 


vxr\x xxx i/v\ x 


3120 


40 


TTATTAGGTA 


TTGTTTTCGG 


•rvrpr" t\ ft TTZV'I " i " I 1 & 2VT*f"' 


PATTAATGGG 


TATPflTfTTT 

X «» X Vv\7 X W XXX 


31B0 


ATTTCGACGA 


TGATTGCTAT 


TYIPfi'P'P'IYi'Fli r r*TYYS*FAf2f3*TY2 
luUnl X iVfln X lUUinuuiv 


TCATTTATGT 

X X X X^& -A VJ 4. 


TGTAGATGCA 


3240 




CTTGCTTAAG 


TAAAA lUAnu 


r , ^r"T w rr , a aaa O Al»fl£Ifi. , TY5*Ffi 
V«,V«j\j X X wirtrln unnuvauiuxu 


ACATGAAGTT 


TGTGTCATAT 


3300 


45 


ccrrrrivrr 


GTGTTTATGA 


AGCATAAAAA AGGGGCGCTA 


CCTACAATAA 


GTAAGATACG 


3360 




CCCATATTTT 


TATATTTTAC 


TATTATTGTT TTTCAATACG 


ATTAATAGTT 


ACATTTAGTC 


3420 




CAAAATATTT 


TTCTAAAAAA 


TGTTTATAGT TATCTTTAGT 


GACATCAAAT 


TTTTCTGAGC 


3480 


60 


TACCATTCCT 


TGTTAAAGTT 


AAATGATTTT CAGACATTGT 


AGCACGGCCA 


AATGATTGTG 


3540 




GCATTGTAAT 


TAATAAATGC 


TGTACAAATA TTGAATCTGG 


ATGCGTTTGA 


TTATATTCGA 


3600 
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AATGATCATT 


TTCGAATTTT 


TGAACATAGA 


AAATATCCTT 


GTCTTCGTTG 


TTAAAAATAG 


3720 




CGCGGAATGT 


ACCACTGATA 


TCAGTAATTG 


GTTGTGTATG 


CTCAGATGAA 


GTAATAGGAA 


3780 


5 


TGGCATGTAG 


AGGTAAGTCT 


CCAAAGCCAA 


CATCAGTTAC 


ATAGAATACA 


TCATTTATAG 


3840 




AAACAACAAG 


TGAAGCATGT 


GAACCGTTCA 


GACTACGACC 


GCCACCGGGw 


GTGTGAATAG 


3900 




TAGCTGACAT 


TAATTCAGGA 


TTAAATCCTT 


TTTGTTGTAA 


ATAGGCTTTG 


AAAAATGTAT 


3960 


10 


TTAATTCATA 


ACAAAAACCA 


CCACGTTTAT 


CATGAACAAT 


TTTATTAAAA 


AGTGCATCGA 


4020 




TATTTATAGA 


TATCGGCTTA 


CTATTTTGAA 


CATCAATATT 


TTCAAAAGGT 


ACAGTTAACA 


4080 


15 


TAAAACGTGT 


TGCATAATAA 


TTTAATGCTT 


CAATACTCGG 


TCGATTATAA 


CGAGATGAAT 


4140 


CAATTTGTAA 


ATAATTCTCT 


AACTTCGCAA 


TATTCATAAG 


CATAGCGCCT 


CCTGTATTAA 


4200 




AGATTATAAT 


TAAATTTTAA 


ACAGAAATAC 


TGAAATTTTA AATTCGAAAG 


CATTGAATTT 


4260 


20 


TGGATAAATA 


CATTTTAAAT 


AGAAAAATAC 


GCTCTCAAAA 


TGAAGTCATC 


TCTAAAAGAA 


4320 




ACGATTTAAA GATGACTACT GAGAGCGTAg 


CATAATGGAA 


GAAGTGTGCA 


GGGTGTCTAA 


4380 




AAATGCAACA 


ATACAAAGGT 


AGTTGCAAGA 


CAAGTTGCCT 


TATCTAGACC 


ATTTGTGTTC 


4440 


25 


TATGCGACCA 


AACTTCCAAA 


TTAAACTTGA 


AATAAGCCAA 


GTAATTAAAA 


ATAATGCAAC 


4500 




TAAAATATAG 


CCTAAATAAT 


CAAATTCGAT 


CGAACCAATG 


AATGCCCAAA 


ACGCACCATG 


4560 




TAAATCTAAC 


TTATCAGCAA 


GAATTTGTAG 


CAATTCAATC 


ATCCCAATCA 


CTAATGCTGC 


4620 


30 


CATGACTGAT ATCGCAGTAA TCGTTATATT GTAATAGATT TTGCGAATAG 


GATTGAAGAA 


4680 




TGCCCAATTA 


TAGGCATACT 


TCATTACAAC 


ACCATCTAAT 


GTATCCAATA 


AACTCATACC 


4740 




TGATGGGAAT AAAATTGGTA AAGATAAGAT 


TCCGATAAAT 


GAAATGGCTT 


GTTGTGATGC 


4800 


35 


GCCTGAAGAA 


AGAGCGAGTA ACGCAATTTC ACTAGCTGTA TCAAAACCAA 


GTCCAAATAA 


4860 




AAAGCCAAGT 


GGCAATACGT 


GCCAACTACG 


CGTGATTAAT 


TTGAAATAAG 


GTCCTACAAA 


4920 


40 


TCGAGAAACC 


AATCCTCTAG 


ATTCAAGTAA 


TGCATCGACT 


TCAGCTTCTT 


CAATGTGTTC 


4980 


ACGACGTAAT 


TTAGCGAACA 


AGTTAATTAA 


AGAGATTAAA 


ATAATTAGAT 


TCAACACACC 


5040 




GATAAGCACT 


AAAAAGAAAC 


CTGAAACTAG 


TGTACCAATC 


GTTCCACCAA 


TATCTTGGAA 


5100 


45 


ATGCGGTAAT 


TCATCTTTAG 


CCCATTTTAC 


AGATACCCCT 


AAAAAAACAG 


CCATTAAAAA 


5160 




TACGACAGAT 


GAATGTCCAA 


TTGAAAAATA 


GAAACCCACA 


CCAGATGGAT 


CTTTGCGTTG 


5220 




CTGTAATAAT 


TTGCGaACCG 


TATTATCTAT 


TGCAGCAATG 


TGATCTGCAT 


CAAATGCATG 


5280 


50 


ACGCAAACCT 


AATGTATATG 


CAAGAATCCC 


CaTACCAAAT 


AAGATATGAT 


GGTCTTTTCC 


5340 




AGCAATC CAT 


AAAAAACTAA 


ACCCAATAAC 


GTGTAACAAA ATGACAATAG 


CTATGTATGG 


5400 
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ATATTTAATC ATACTGTATG TTCAATCGGC ACTCTAGTAA TAAGTGTTCA TATAACAAAA 5520 

ATGTTATGCC AAATTATTTG TTATATAAAA ATATACATGT AAOCACAAAA GATTTTTTGC 5580 

5 GATATATATA ATTTGATAAA TTAACCAACA ACAATGTAAG ATGTCACTTT GCTTAACTTG 5640 

GCATCCTTTT TATGATTTTC AAATTCAAAA AAATGAGCAA AATGAATCTC TTTAcCAGTT 5700 

TTTAATATTT CaATACCATG CATGGAACCT AAGCACCCAT GTGTGATGCT GGAATGGATA 5760 

10 

TTGAGACTAG CAACCTGATT GTAATGATTA GATAGTTCTT GAATTAATAT TTGAGGTCCG 5820 

TATATGTCAA AGCGGCCAGG GACAGACCAA ATAAATTCTG TTGTAACCAG TGAACGTAAT 5880 

AATTCAATAT CTAATGCTOC TGTAACAACT ATAAAATCTA TCATTTGTTG ACGTTTAGGC 5940 

IS 

GCATGATTGC ATGACACATC TCCTGTTAAC TTAAAAGGTA ATGATGACTG AACTTCCGTT €000 

TTAAAATGTA GTTGGTGCTG AAATAAAGCT TGTTC 6035 
20 (2) INFORMATION FOR SEQ ID NO: 273: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1039 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 273: 



35 



40 



45 



TTTTGAACAG 


CCATATTTAT 


TCACCCTCAA 


CATCATTATA 


ATGGTATTAG 


TCGCATTACC 


60 


TTCACTTGTT 


TTAGCTATAT 


ATGATTATAT 


GAGTTTTAGA 


ATTTCTTCTG 


CTATTTTACA 


120 


ATTTCTAGGG 


GCTATCTCTT 


GGTTCTTTTT 


AT CATTG AT A 


TTATCGCTGA 


CACAATTT A C 


180 


ACCTTTTACA 


TTAGCGTCAT 


TTATAACTTC 


AATTATTTTG 


TTCACAAGCA ^CAATTATCAC 


240 


ATTAGCCATT 


GGTGGTAAGT 


CTGTTGAAAA 


GAATGATTCC 


CCTTAAATTC 


CAAATGAAAA 


300 


AAAGGTTCTG 


AAGGCCGCTA 


TAAAACACAG 


TTTTTCAGAA 


CCTCTATACT 


TCTATTCAAT 


360 


GATATATGGT 


TTGCAATTTT 


CTACCTTTAA 


ATCCACAGCT 


TCTGCCCTTG 


AAACTTTGTT 


420 


AAAATAAACC 


ATCAAACAAC 


GAATGACAAC 


TTGATGTGCA 


ACAATGACAA 


TATCATCTTT 


480 


TTGTGTATCT 


TCATTGACAA 


CATGATTCAT 


AAAATGTTCT 


ACGCGTTGAT 


ATACATCTTC 


540 


ATAACTTTCT 


CCTTCAGGCG 


CTTTTTGTGA 


AAAACTATGA 


CGAAAGTCTT 


TAAAGTTTGG 


600 


ATCATTGAAA 


TATTTTTCAT 


ATTTCGGATT 


CGCACTGATT 


TCATCTTTAT 


ATTCACCCTC 


660 


AAATACGCCA 


AGTGAACGTT 


CTCTTAATAG 


AGGGGTAGTC 


GTTGATGCAA 


TGTCATATGG 


720 


AAAAATATGT 


TCAAACGTTT 


GCTGTGITCT 


TAATAAGTCT 


GAAACATATA 


CATGTTTAAT 


780 
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CGGCACATCT AATTGTCCAC AAAAATAAGA TCGAAAATGT TTATTATCAT AATTCGATTT 900 

TQATTCGCCA TGTCTAACTA AATAAATCOT CATAATATTA CTCCTTACCT TATGTATTTC 960 

6 ATATCTACCA TAACACTTTG ACTACTAATT CGATATCAAT CTTAATATTC TATTCTAAAA 1020 

AAAGAATTAA TTCATATnT 1039 



(2) INFORMATION FOR SEQ ID NO: 274: 

10 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1496 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 274: 



on 


GAGAGAATnT 


GCAATTAGTT 


ATTCAATTAG 


TTGATTTAAG 


ACATGATCCA 


ACACAAGATG 


60 




ATATCTTAAT 


GTACAATTAT 


TTGAAACATT 


TTGATATTCC 


TACTTTAGTT 


ATATGCACTA 


120 




ArGAaGACAA 


AATTCCaAAA 


GGTAAGGTyC 


AAAAG CAT AT 


TAAAAATATT 


AAGACACAAT 


180 


25 


TAGATATGGA 


CCCAGACGAT 


ACAATTGTAA 


GTTATTCATC 


AATTCAAAAT 


AATAmaCAAC 


240 




AACAAATATG 


GAATTTAATT 


GAACCGTATA 


TTTCATAGTT 


TTTGTACGTC 


AAAACTTATA 


300 




CAAAAATTTT 


AAAAATAATG 


TAAGCACGAA 


ACTTTTAATT 


AGTACACAAT 


TGATAACATT 


360 


30 


TTTCAACGTT 


CATCATTTTG 


TCAAAAACTC 


AAAAGTAAAT 


TAGAAAGATT 


ATAATTTATT 


420 




TAAGCATCGT 


ACTTAATTGG 


ATTTTAAATT 


ATGTTATAAT 


ATTTGTATTG 


TTAGTATATA 


480 




TGGGGGCTTT 


TCAAATG CAT 


TTTATTGCAA 


TTAGTATAAA 


TCATCGCACA 


GCTGATGTgC 


540 


35 


ACTAAGAGAG 


CAAGTTACTT 


TTAGAGATGA 


TGCCTTACGA 


ATTGCCCATG 


AAGATTTATA 


600 




TGAAACTAAA 


TCTAyTTTAG 


AAAATGgTCA 


TATTaTCAAC 


ATGTAATCGA 


ACTGAAGTAT 


660 


40 


ATGCTGTTGT 


TGATCAAATT 


CACACAGGTC 


GTTACTATAT 


TCAACGATTT 


CTAGCTCGTG 


720 


CATTTGGATT 


TGAAGTAGAT 


GATATTAAAG 


CAATGTCAGA 


AGTAAAAGTG 


GGGGACGAAG 


780 




CaGTAGAACA 


TTTATTGCGT 


GTCACTTCTG 


GTTTAGATTC 


AATCGTACTT 


GGAGAAACTC 


840 


45 


AAATTTTAGG 


TCAAATAAGA 


GATGCATTTT 


TCTTAGCGCA 


AAG CACAGGT 


ACGACAGGrA 


900 




CAATTTTTAA 


TCATCTATTT 


AAACAGGCAA 


TTACTTTTGC 


AAAAAGAGCA 


CATAATGAAA 


960 




CAGATATAGC 


TGATAATGCT 


GTAAGTGTGT 


CTTATGCTGC 


GGTCGAGTTG 


GCGAAAAAAG 


1020 


60 


TATTTGGCAA 


ATTGAAAAGT 


AAGCAAGCTA 


TCATTATTGG 


TGCAGGGGAA 


ATGAGTGAAT 


1080 




TATCACTATT 


AAATCTTCTT 


GGTTCTGGAA 


TTACTGaTAT 


TACAGTAGTA 


AATAGAACAA 


1140 



55 



1088 



EP0 786 519 A2 



TACCAAATTT ACTTGAAAGT GCAGATATTG TGATTAGTTC AACGAGTGCA CAATCTTATA 1260 

TCATTACAAA TQAAATGATA GAAAGAATTG CAGAAAATAG AAAGCAAGAT TCACTAGTAT 1320 

TGATTGATAT TGCAGTTCCT CGAGATATTG AACCTGGTAT TAGTGCCATC ACAAACATCT 1380 

TTAATTATGA TGTTGATGAC TTAAAAGGTT TAGTTGATGC AAACTTACGT GAGCGACAAT 1440 

TAGCGGCTGC AACAATTTCG GAACAAATTC CTACAGAAAT ACATGCACAC AATGAG 1496 



10 

(2) INFORMATION FOR SEQ ID NO: 275: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4826 base pairs 

(B) TYPE: nucleic acid 
15 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 275: 





CTTGATTTTT 


TCCCtTTAGT 


ATTTTCCaTt 


TGanTGTCGC 


AGCTTCTAAA 


TCCTGCTTTG 


60 




GTTCTCTAGT 


GAACTTCATA 


ATTAAAGCAG 


CTACAACGAA* TGATACAAGT GCAGCAAGGA 


120 


25 


AGACACCGAG 


TAACATGTGC 


AAGAATTCAC 


CTCTAGGTGC 


ATTTAAACAG 


TAAACTATAA 


180 




ATGAACCTGG 


TGACGCGGGA 


CTTTTAAATC 


CAAATCCTGT 


TGCTTGATAA 


GTTGCAACAC 


240 




CAGTCATTCC 


ACCTAAAATA 


ACAGCGATAA 


AT AATAAAGG 


ACGCATTAAT 


ACATATGGGA 


300 


30 


AATAAATTTC 


ATGAATACCA 


CCTAAGAAGT 


GGATAATTCC 


AGCACCATAT ,-GACGTTGCTT 


360 




TTGCAGTGCC 


TTTTCCAAAA 


ATCATATAAG 


CAAGTAAGAT 


AC CT AAACCT 


GGTCCAGGGT 


420 


35 


TAGATTCAAT 


TGTGTATAAA 


ATTGATTGAC 


CAGCTTTTGC AGCTTGATCT 


GCACCAAGCG 


480 


GTGTGAATAC 


ACCATGGTTA 


ATCGCATTGT 


TTAAAAATAC, AATTTTTGCA- GGCTCTACTA 


540 




AAATACTTAC 


AAGTGGAAGT 


AGGTGTGCAT 


GTACTAATGC 


TTCAACTGCC 


ACTGATAAAA 


600 


40 


TATGCATAAT 


AAATTTCATA 


AGTGGTGCTA 


AAATTTTAAA 


TCCTGCAATC 


GTCATGATAA 


660 


ATCCTAAAAT 


ACCAGCAGAA 


AAGTTATTAA 


ATAACATTTC 


AAAACCTTGC 


GGCGTTCTAG 


720 




GTTGAATCAA 


TTGGTCGGTC 


TTCTTCATTA 


ACCAACCAAC 


AAGTGGACCC 


ATAATCATTG 


780 


45 


CACCAAGTAA 


CATTGGTGTA 


TCAGGTAATG 


CAACGATGAC 


CCCCATAGTT 


GCTGTTGCTG 


840 




CGATGATACC 


ACCACGTAAA 


TCATAAATTA 


AACGACCACC 


ACTAAATGCG 


ATCAATAATG 


900 




GGATTAAATA 


AGTAATCATT 


GGTCCTGCTA 


AAGTAGCTAA 


ATCTTTGTTA 


GGTAACCATC 


960 


50 


CATTATCTAT 


AAAAATGGCC 


GCGATAAAAC 


CCCAAGCGAT 


GAAAGCGCCA 


ATGTTTGGCA 


1020 




TGATCATACT 


ACTTAAGAAT 


GATCCAAATG 


CTTGAACACG 


ACGACCAATT 


CCTTTTTTCT 


1080 



55 



1089 



